Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10362/104211| Título: | Modelos Supervisionados Aplicados à Deteção de Fraude em Seguros de Saúde |
| Autor: | Santos, Filipe Alexandre da Silva |
| Orientador: | Bispo, Regina |
| Palavras-chave: | Fraude em Seguros de Saúde Sistemas de Deteção de Fraude Aprendizagem Supervisionada |
| Data de Defesa: | Jul-2020 |
| Resumo: | Estima-se que a fraude na área da saúde represente um problema na ordem dos 3% a 10% dos orçamentos de alguns países para este setor e que, no caso particular dos seguros de saúde, os prejuízos ascendam a vários milhões de euros. Este problema tem levado estados e seguradoras a implementar Sistemas de Deteção de Fraude sofisticados, compostos por ferramentas automáticas que procuram identificar os padrões de fraude conhecidos seguido de um processo manual de inspeção por especialistas. Contudo, estes sistemas apresentam várias limitações, e algumas técnicas de deteção de fraude baseadas em modelos data driven têm vindo a ser incorporadas nestes sistemas. Apesar de se terem revelado eficientes, a natureza dos datasets deste setor - o conjunto de pedidos de reembolso feitos às seguradoras - traz também muitos desafios à sua implementação, nomeadamente a distribuição enviesada de classes (uma proporção muito elevada de pedidos de reembolso legítimos face aos pedidos de reembolso suspeitos) ou o concept drift (a natureza dos padrões de fraude muda com o tempo). Estas características dificultam a aplicação de técnicas de aprendizagem automática e são necessárias abordagens específicas para a sua resolução. Nesta tese apresenta-se uma solução de aprendizagem automática supervisionada de deteção de fraude, solicitada por um grupo internacional privado que faz a gestão dos seguros de saúde de algumas seguradoras. Usou-se, para esse efeito, o datatset constituído pelos pedidos de reembolso respeitantes aos anos de 2017 e 2018 que haviam sido classificados como legítimos ou suspeitos pelos auditores. Foram consideradas 4 famílias de classificadores - Regressão Logística, Random Forest e Support Vector Machine e XGBoost e os seus desempenhos foram medidos e comparados. Os resultados obtidos evidenciaram a utilidade destes classificadores, tendo o Random Forest e o XGBoost apresentado melhores resultados. |
| URI: | http://hdl.handle.net/10362/104211 |
| Designação: | Mestre em Engenharia e Análise de Big Data |
| Aparece nas colecções: | FCT: DI - Dissertações de Mestrado |
Ficheiros deste registo:
| Ficheiro | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Santos_2020.pdf | 677,45 kB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.











