Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10362/151106| Título: | Indução de Regras para a Classificação Automática da Severidade de Risco de Incêndios Florestais |
| Autor: | Severino, Gonçalo Bernardo |
| Orientador: | Nascimento, Susana Damásio, Carlos Bugalho, Maria Lourdes |
| Palavras-chave: | fuzzy c-means árvores de decisão florestas aleatórias RIPPER SIRUS extração de regras |
| Data de Defesa: | Dez-2022 |
| Resumo: | O objetivo desta dissertação é aplicar métodos de mineração de dados a dados de
incêndios florestais de forma a extrair regras interpretáveis na classificação dos graus de
severidade dos incêndios. Foram construídos 12 conjuntos de dados de estudo referentes
a Portugal Continental e a cinco regiões geográficas e caracterizados por duas séries de
índices de risco. Os dados referem-se aos incêndios com uma área ardida maior que 100
hectares ocorridos no território de Portugal Continental entre os anos de 2001 e 2020.
Os dados foram classificados de forma automática não supervisionada com o algo-
ritmo fuzzy c-means com suporte às escalas existentes dos índices de risco. Os resultados
obtidos com este algoritmo foram validados com o índice de validação interno Xie-Beni e
a com o método de visualização fuzzy sammon mapping.
Com os dados etiquetados foi realizado um estudo experimental de algoritmos de
classificação com extração de regras: árvores de decisão, RIPPER e SIRUS; e subsequente
avaliação comparativa dos conjuntos de regras com métricas de interpretabilidade e com
análise por especialista na área.
Conclui-se que o FCM e os algoritmos de extração de regras foram eficazes na aborda-
gem, o classificador RIPPER obteve melhores resultados e a análise por região foi satisfa-
tória. The objective of this dissertation is to apply data mining methods to forest fire data in order to extract interpretable rules for classifying fire severity degrees. Twelve sets of study data referring to Mainland Portugal and five geographic regions were constructed and characterized by two different series risk indices. The data refer to fires with a burned area greater than 100 hectares that occurred in Mainland Portugal between 2001 and 2020. The data were classified in an unsupervised automatic way with the fuzzy c-means algorithm and the existing risk index scales. The results obtained with this algorithm were validated with the Xie-Beni internal validation index and with the fuzzy sammon mapping visualization method. With the tagged data, a comparative experimental study was applied with the clas- sification algorithms with rule extraction: decision trees, RIPPER and SIRUS; and sub- sequent comparative evaluation of the sets of rules with interpretability metrics and analysis by an expert in the field. It is concluded that the FCM and the rule extraction algorithms were effective in the approach, the RIPPER classifier obtained better results and the analysis by region was positive. |
| URI: | http://hdl.handle.net/10362/151106 |
| Designação: | MESTRADO EM ENGENHARIA INFORMÁTICA |
| Aparece nas colecções: | FCT: DI - Dissertações de Mestrado |
Ficheiros deste registo:
| Ficheiro | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Severino_2022.pdf | 14,05 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.











