Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques

Vieira, Maria Inês Trindade

http://hdl.handle.net/10362/144999

Utilize este identificador para referenciar este registo.

Nome:	Descrição:	Tamanho:	Formato:
TEGI0613.pdf		2.46 MB	Adobe PDF	Ver/Abrir

Contacte-nos

Autores

Vieira, Maria Inês Trindade

Orientador(es)

Vilares, Manuel José

Resumo(s)

In recent years, there has been an increased interest in non-life insurance sector, especially in motor insurance segment. In fact, thousands of collisions, crashes, breakdowns, and thefts are reported to Portuguese insurance companies every day. Some with bigger claims than others- the extreme events. Extreme value theory has been used to develop models for describing the distribution of this rare events. Modelling extremes is challenging and there is usually a trade-off between being as close as possible to the "asymptotic regime" and, at the same time, having as much data as possible for estimates to be reliable. An important challenge in the application of such extreme models is the choice of a threshold, beyond which point the asymptotically justified extreme value models can provide good extrapolation. The focus of this study will be the greatest losses. This aims to contribute to the literature of extreme values analysis - modelling extreme values based on thresholds. Moreover, this project pretends analyse the mains factors that facilitate the decision-making process by the insurance company. Several risk factors that could explain the costs’ behaviour are used to model the claims’ severity. The applied methodology will focus on Gradient Boosting machine learning techniques, from which a modelling process is developed on a set of data of Fidelidade Motor Insurance portfolio. The results show that it makes sense to have two borders and to analyse factors of relevance in each segment. Regression models are built, and it is achieved, in the three main models developed, vehicle category is always very present as the main responsible variable followed by the variable’s year analysis and years in portfolio.

Nos últimos anos, tem-se assistido a um grande interesse pelo setor dos seguros não vida, particularmente no segmento automóvel. De facto, milhares de colisões, despistes e avarias são comunicados diariamente nas seguradoras portuguesas. Alguns com maior gravidade e custos do que outros – os eventos extremos. A teoria dos valores extremos é usada para desenvolver modelos extremos para descrever uma distribuição dos mesmos. A modelagem é um enorme desafio e geralmente há um trade-off entre escolher um valor mais próximo possível do regime assintótico do conjunto dos dados e, ao mesmo tempo, o segmento acima do valor escolhido conter o máximo de dados para existir qualidade na estimação. Um desafio importante na aplicação de tais modelos é a escolha de um valor fronteiro- a partir do qual os modelos de valores extremos podem fornecer uma boa extrapolação. O foco deste estudo será os custos mais elevados existentes com sinistros automóveis (apenas sobre a cobertura de responsabilidade civil). O mesmo visa contribuir com literatura sobre valores extremos e modelação de valores extremos com base em fronteiras. Além disso, pretende-se neste estudo analisar as principais variáveis que explicam os modelos. Vários fatores de risco que podem explicar o comportamento dos custos são usados para modelar a gravidade dos sinistros. A metodologia é aplicada à carteira de dados da Fidelidade. Os modelos são criados utilizando a técnica de Gradient Boosting Machine. Os resultados mostram que faz sentido ter duas fronteiras e analisar fatores de relevância em cada segmento. São construídos três modelos de regressão e a categoria do veículo é o fator de relevância que aparece mais presente como a principal variável responsável do modelo, seguida do fator ano do sinistro e do número de anos de carteira do segurado.

Descrição

Internship Report presented as the partial requirement for obtaining a Master's degree in Statistics and Information Management, specialization in Risk Analysis and Management

Palavras-chave

Motor Insurance Claims Severity Extremal Events Prediction Models Gradient Boosting Seguro Automóvel Responsabilidade Civil Automóvel Gravidade de Sinistros Eventos Extremos Modelos Preditivos

URI

http://hdl.handle.net/10362/144999

Coleções

NIMS - Dissertações de Mestrado em Estatística e Gestão da Informação (Statistics and Information Management)

Ver registo completo