| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 5.57 MB | Adobe PDF |
Autores
Orientador(es)
Resumo(s)
Colorectal Cancer (CRC) is the fourth most common cancer and the third deadliest type
of cancer in the world. The identification of associations between germline mutations
and the increased risk for CRC development could allow not only a better follow-up of
the clinical condition of the patient, but also the follow-up of its relatives. The germline
mutations, which are inherited from parents, can be regarded as biomarkers, which are
indicators of increased CRC risk and also give relevant information about disease processes
or therapy response that can be measured accurately and reproducibility. This
strategy follows the precision medicine approach that takes into account individual genetic
variability, environment, and lifestyle of each person for cancer prevention and
to guide clinicians on the best clinical approach to treat a patient, potentially avoiding
less efficient treatments and contributing to lower toxicities and to the reduction of costs
on the health system. The integration of large amounts of data produced by Next Generation
Sequencing (NGS) and development of machine learning and feature selection
techniques increases the potential of identifying new relevant genetic variants in CRC
that may be used in genetic diagnosis, in the clinical practice, after validation in larger
and independent cohorts. This will fuel research and scientific knowledge, shedding new
light to understand disease mechanisms and help clinical decision-making and ultimately
assist therapy research. This work proposes a framework based on regularized logistic
regression to select genetic mutations in CRC. The framework is divided in 3 major
subsections: first, data integration, data cleaning and variable construction; second, classification
modeling, feature selection and analysis of common features between patient
groups; third, validation of the biomarkers selected by the model. Nowadays, the Molecular
Pathobiology Research Unit (MPRU) of the Portuguese Oncology Institute of Lisbon,
Francisco Gentil, follows international guidelines that establish which biomarkers are to
be analysed in the genetic profile of a patient. This work will contribute to ascertain new
biomarkers in a prompt and constructive manner that are correlated with the augmented
risk of developing CRC.
O cancro do cólon e recto é o quarto cancro mais comum e o terceiro mais mortífero no mundo. A identificação de associações entre mutações germinativas e o risco aumentado do desenvolvimento do cancro do cólon e recto pode possibilitar um melhor seguimento do paciente, assim como, dos seus familiares. As mutações germinais, que são herdadas dos pais, podem ser consideradas biomarcadores, que são indicadores de processos de doença ou de terapia de resposta que podem ser medidos com precisão e reprodutibilidade. Esta estratégia segue a abordagem da medicina de precisão que tem em consideração a variabilidade da genética individual, ambiente, e o estilo de vida de cada pessoa para a prevenção do cancro e para guiar o pessoal clínico na melhor abordagem de tratamento de um paciente, potencialmente evitando tratamentos menos eficientes e contribuindo para a baixa toxicidade e redução dos custos no sistema de saúde. A integração de grandes quantidades de dados produzidos pelo NGS e desenvolvimento de técnicas de machine learning e de feature selection aumentou o potencial de identificar novas variantes genéticas relevantes no CRC que podem ser usadas em diagnósticos genéticos, na prática clínica, após a validação em coortes grandes e independentes. Isto, irá alimentar a pesquisa e o conhecimento científico, lançando uma nova luz para compreender os mecanismos da doença e ajudar na tomada de decisão clínica e, finalmente, auxiliar na pesquisa de terapia. Este trabalho propõe uma framework baseada em algoritmos de regularização logística para seleccionar mutações genéticas. A framework pode ser dividida em 3 secções: primeiro, a integração dos dados, limpeza dos dados e construção de variáveis; segundo, o desenvolvimento de modelos de classificação, selecção de variáveis e análise de variáveis comuns entre grupos de pacientes; terceiro, validar os biomarcadores seleccionados pelo modelo de aprendizagem automática. Hoje em dia, a Unidade de Investigação Patobiologia Molecular do Instituto Português de Oncologia de Lisboa, Francisco Gentil, segue normas internacionais que estabelecem quais os marcadores que devem ser analisados no perfil genético de um paciente. Este trabalho vai contribuir para verificar novos biomarcadores, de uma maneira expedita e construtiva, que estão correlacionados com um risco aumentado de desenvolver cancro do cólon e recto.
O cancro do cólon e recto é o quarto cancro mais comum e o terceiro mais mortífero no mundo. A identificação de associações entre mutações germinativas e o risco aumentado do desenvolvimento do cancro do cólon e recto pode possibilitar um melhor seguimento do paciente, assim como, dos seus familiares. As mutações germinais, que são herdadas dos pais, podem ser consideradas biomarcadores, que são indicadores de processos de doença ou de terapia de resposta que podem ser medidos com precisão e reprodutibilidade. Esta estratégia segue a abordagem da medicina de precisão que tem em consideração a variabilidade da genética individual, ambiente, e o estilo de vida de cada pessoa para a prevenção do cancro e para guiar o pessoal clínico na melhor abordagem de tratamento de um paciente, potencialmente evitando tratamentos menos eficientes e contribuindo para a baixa toxicidade e redução dos custos no sistema de saúde. A integração de grandes quantidades de dados produzidos pelo NGS e desenvolvimento de técnicas de machine learning e de feature selection aumentou o potencial de identificar novas variantes genéticas relevantes no CRC que podem ser usadas em diagnósticos genéticos, na prática clínica, após a validação em coortes grandes e independentes. Isto, irá alimentar a pesquisa e o conhecimento científico, lançando uma nova luz para compreender os mecanismos da doença e ajudar na tomada de decisão clínica e, finalmente, auxiliar na pesquisa de terapia. Este trabalho propõe uma framework baseada em algoritmos de regularização logística para seleccionar mutações genéticas. A framework pode ser dividida em 3 secções: primeiro, a integração dos dados, limpeza dos dados e construção de variáveis; segundo, o desenvolvimento de modelos de classificação, selecção de variáveis e análise de variáveis comuns entre grupos de pacientes; terceiro, validar os biomarcadores seleccionados pelo modelo de aprendizagem automática. Hoje em dia, a Unidade de Investigação Patobiologia Molecular do Instituto Português de Oncologia de Lisboa, Francisco Gentil, segue normas internacionais que estabelecem quais os marcadores que devem ser analisados no perfil genético de um paciente. Este trabalho vai contribuir para verificar novos biomarcadores, de uma maneira expedita e construtiva, que estão correlacionados com um risco aumentado de desenvolver cancro do cólon e recto.
Descrição
Palavras-chave
Colorectal Cancer genetic variants germline mutations feature selection machine learning precision medicine
