| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 12.4 MB | Adobe PDF |
Autores
Orientador(es)
Resumo(s)
Cancer is the world’s second leading cause of death, summing up an estimated 10 million
deaths in 2020. Breast cancer is the fifth-highest death cause among all cancer types,
being the first in incidence and prevalence. Several predictions and statistics suggest that
worldwide incidences of breast cancer are rising, opening doors to developing decision
support systems that may help clinicians improve their patients’ prognoses.
This thesis focuses on profiling and characterising breast cancer patients from the
Hospital Universitario Puerta de Hierro Majadahonda (HUPHM), estimating the survival
probabilities regarding several features using the Kaplan-Meier estimator, assessing the
survival outcome between patients with different treatments, prognoses, age distribution,
and others. The whole cohort of patients was subject to a complete descriptive analysis
reported to the associated clinicians.
Throughout the dissertation, the raw dataset provided by the partner Hospital was
preprocessed, transformed and stored in a database, allowing clinicians to access their
data through a previously built dashboard. Moreover, a tool that assists physicians in
predicting the occurrence of relapse was explored since an early diagnosis of the reap-
pearance of cancer can be crucial to the patient’s prognosis.
The results obtained through the implementation of the methodology proposed re-
garding the relapse prediction conclude that the dataset is statistically irrelevant, proba-
bly due to the vital information loss in the middle age group (the dataset provided only
contained patients until 45 and more than 65 years old). Nevertheless, the descriptive and
survival analysis performed in the cohort of patients available is highly relevant to the
clinical practice since it is the first time these patients are being described and analysed.
O cancro é a segunda principal causa de morte a nível mundial, totalizando uma esti- mativa de 10 milhões de mortes em 2020. O cancro da mama é a quinta maior causa de morte entre todos os tipos de cancro, sendo a primeira em incidência e prevalência. Várias previsões e estatísticas sugerem que a incidência mundial do cancro da mama está a aumentar, abrindo as portas ao desenvolvimento de sistemas de apoio à decisão que podem ajudar os clínicos a melhorar os prognósticos dos seus pacientes. Esta tese centra-se na caracterização e segmentação de doentes com cancro da mama do Hospital Universitario Puerta de Hierro Majadahonda (HUPHM). Durante a dissertação criaram-se ferramentas que permitem calcular as probabilidades de sobrevivência utili- zando o estimador Kaplan-Meier, avaliando a sobrevivência entre doentes com diferentes tratamentos, prognósticos, distribuição etária, entre outros. A totalidade dos pacientes foi sujeita a uma análise descritiva completa, disponibilizada aos clínicos associados ao projecto. Ao longo da dissertação, o conjunto de dados inicialmente fornecido pelo Hospital parceiro foi pré-processado, transformado e armazenado numa base de dados, permitindo aos clínicos o acesso aos dados dos seus pacientes através de um plataforma web previa- mente desenvolvida. Além disso, foi explorada uma ferramenta que auxilia os médicos a prever a ocorrência da recaída, uma vez que um diagnóstico precoce do reaparecimento do cancro pode ser crucial para o prognóstico do paciente. Os resultados obtidos através da implementação da metodologia proposta relativa- mente à previsão de recaída concluem que o conjunto de dados é estatisticamente irre- levante, provavelmente devido à perda de informação vital na faixa etária intermédia (o conjunto de dados fornecido continha apenas pacientes até 45 e superior a 65 anos de idade). No entanto, a análise descritiva e de sobrevivência realizada nos pacientes dispo- nibilizados é altamente relevante para a prática clínica, uma vez que é a primeira vez que estes pacientes estão a ser descritos e analisados.
O cancro é a segunda principal causa de morte a nível mundial, totalizando uma esti- mativa de 10 milhões de mortes em 2020. O cancro da mama é a quinta maior causa de morte entre todos os tipos de cancro, sendo a primeira em incidência e prevalência. Várias previsões e estatísticas sugerem que a incidência mundial do cancro da mama está a aumentar, abrindo as portas ao desenvolvimento de sistemas de apoio à decisão que podem ajudar os clínicos a melhorar os prognósticos dos seus pacientes. Esta tese centra-se na caracterização e segmentação de doentes com cancro da mama do Hospital Universitario Puerta de Hierro Majadahonda (HUPHM). Durante a dissertação criaram-se ferramentas que permitem calcular as probabilidades de sobrevivência utili- zando o estimador Kaplan-Meier, avaliando a sobrevivência entre doentes com diferentes tratamentos, prognósticos, distribuição etária, entre outros. A totalidade dos pacientes foi sujeita a uma análise descritiva completa, disponibilizada aos clínicos associados ao projecto. Ao longo da dissertação, o conjunto de dados inicialmente fornecido pelo Hospital parceiro foi pré-processado, transformado e armazenado numa base de dados, permitindo aos clínicos o acesso aos dados dos seus pacientes através de um plataforma web previa- mente desenvolvida. Além disso, foi explorada uma ferramenta que auxilia os médicos a prever a ocorrência da recaída, uma vez que um diagnóstico precoce do reaparecimento do cancro pode ser crucial para o prognóstico do paciente. Os resultados obtidos através da implementação da metodologia proposta relativa- mente à previsão de recaída concluem que o conjunto de dados é estatisticamente irre- levante, provavelmente devido à perda de informação vital na faixa etária intermédia (o conjunto de dados fornecido continha apenas pacientes até 45 e superior a 65 anos de idade). No entanto, a análise descritiva e de sobrevivência realizada nos pacientes dispo- nibilizados é altamente relevante para a prática clínica, uma vez que é a primeira vez que estes pacientes estão a ser descritos e analisados.
Descrição
Palavras-chave
Breast Cancer Data Engineering Survival Analysis Kaplan-Meier Relapse Logistic Regression
