Utilize este identificador para referenciar este registo: http://hdl.handle.net/10362/71034
Registo completo
Campo DCValorIdioma
dc.contributor.advisorSilva, Joaquim-
dc.contributor.advisorJacinto, Maria Celeste-
dc.contributor.authorFerreira, Rodolfo Simões-
dc.date.accessioned2019-05-28T15:41:46Z-
dc.date.available2019-05-28T15:41:46Z-
dc.date.issued2018-12-
dc.date.submitted2018-
dc.identifier.urihttp://hdl.handle.net/10362/71034-
dc.description.abstractAs estatísticas retiradas dos acidentes de trabalho são de grande importância, pois é com base nelas que é gerada nova legislação, políticas de prevenção e campanhas de sensibilização contra acidentes de trabalho. Tendo em conta a importância destes dados, é fundamental procurar garantir que a informação declarada em cada acidente não contenha erros provenientes de declarações descuidadas geradoras de combinações improváveis ou impossíveis entre o conteúdo das diferentes variáveis categóricas que constituem cada declaração. Pretende-se pois assegurar que os dados estatísticos resultantes desse processo sejam fiáveis. Assim, com base num histórico de declarações corretas já existentes, foi possível construir um modelo de validação de futuras declarações de acidentes. O Desafio em termos informáticos surgiu na medida em que cada acidente é descrito por 22 variáveis categóricas em que cada uma pode assumir vários valores discretos possíveis, o que implica uma explosão combinatória de diferentes padrões de acidentes. Esta explosão exigiu a escolha de abordagens de Data Mining adequadas de modo a que a completude e a qualidade do modelo de validação não ficassem comprometidas. A título de exemplo, se cada uma das 22 variáveis admitir 10 possíveis valores, o número de combinações possíveis é dado por 1022, o que configura uma complexidade que é partilhada nesse aspeto com os ambientes onde são tratados grandes volumes de informação. Nesta dissertação foi desenvolvida uma abordagem Data Mining que, com base na deteção de combinações improváveis ou impossíveis entre o conteúdo das diferentes variáveis categóricas que constituem cada declaração, permite a classificação de futuras declarações numa de três classes: “válidas”, “inválidas” ou “suspeitas”. Foram atingidos valores de accuracy na ordem dos 85% . Esta dissertação está ancorada numa proposta de projeto, ainda em avaliação pela FCT. O GEP, que é parceiro na proposta de projeto, incluirá a abordagem desenvolvida nesta dissertação, como módulo de validação da qualidade das declarações de acidentes de trabalho.pt_PT
dc.language.isoporpt_PT
dc.rightsopenAccesspt_PT
dc.subjectdeclarações de acidentespt_PT
dc.subjectvariáveis categóricaspt_PT
dc.subjectData Miningpt_PT
dc.subjectcombinações improváveispt_PT
dc.titleDeteção automática de combinações improváveis de variáveis categóricas no contexto dos acidentes de trabalhopt_PT
dc.typemasterThesispt_PT
thesis.degree.nameMestre em Engenharia Informáticapt_PT
dc.subject.fosDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informáticapt_PT
Aparece nas colecções:FCT: DI - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Ferreira_2018.pdf1,47 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.