Logo do repositório
 
A carregar...
Miniatura
Publicação

Identification of Colorectal Cancer Genetic Biomarkers via Regularized Classification Models

Utilize este identificador para referenciar este registo.
Nome:Descrição:Tamanho:Formato: 
Eusebio_2022.pdf5.57 MBAdobe PDF Ver/Abrir

Resumo(s)

Colorectal Cancer (CRC) is the fourth most common cancer and the third deadliest type of cancer in the world. The identification of associations between germline mutations and the increased risk for CRC development could allow not only a better follow-up of the clinical condition of the patient, but also the follow-up of its relatives. The germline mutations, which are inherited from parents, can be regarded as biomarkers, which are indicators of increased CRC risk and also give relevant information about disease processes or therapy response that can be measured accurately and reproducibility. This strategy follows the precision medicine approach that takes into account individual genetic variability, environment, and lifestyle of each person for cancer prevention and to guide clinicians on the best clinical approach to treat a patient, potentially avoiding less efficient treatments and contributing to lower toxicities and to the reduction of costs on the health system. The integration of large amounts of data produced by Next Generation Sequencing (NGS) and development of machine learning and feature selection techniques increases the potential of identifying new relevant genetic variants in CRC that may be used in genetic diagnosis, in the clinical practice, after validation in larger and independent cohorts. This will fuel research and scientific knowledge, shedding new light to understand disease mechanisms and help clinical decision-making and ultimately assist therapy research. This work proposes a framework based on regularized logistic regression to select genetic mutations in CRC. The framework is divided in 3 major subsections: first, data integration, data cleaning and variable construction; second, classification modeling, feature selection and analysis of common features between patient groups; third, validation of the biomarkers selected by the model. Nowadays, the Molecular Pathobiology Research Unit (MPRU) of the Portuguese Oncology Institute of Lisbon, Francisco Gentil, follows international guidelines that establish which biomarkers are to be analysed in the genetic profile of a patient. This work will contribute to ascertain new biomarkers in a prompt and constructive manner that are correlated with the augmented risk of developing CRC.
O cancro do cólon e recto é o quarto cancro mais comum e o terceiro mais mortífero no mundo. A identificação de associações entre mutações germinativas e o risco aumentado do desenvolvimento do cancro do cólon e recto pode possibilitar um melhor seguimento do paciente, assim como, dos seus familiares. As mutações germinais, que são herdadas dos pais, podem ser consideradas biomarcadores, que são indicadores de processos de doença ou de terapia de resposta que podem ser medidos com precisão e reprodutibilidade. Esta estratégia segue a abordagem da medicina de precisão que tem em consideração a variabilidade da genética individual, ambiente, e o estilo de vida de cada pessoa para a prevenção do cancro e para guiar o pessoal clínico na melhor abordagem de tratamento de um paciente, potencialmente evitando tratamentos menos eficientes e contribuindo para a baixa toxicidade e redução dos custos no sistema de saúde. A integração de grandes quantidades de dados produzidos pelo NGS e desenvolvimento de técnicas de machine learning e de feature selection aumentou o potencial de identificar novas variantes genéticas relevantes no CRC que podem ser usadas em diagnósticos genéticos, na prática clínica, após a validação em coortes grandes e independentes. Isto, irá alimentar a pesquisa e o conhecimento científico, lançando uma nova luz para compreender os mecanismos da doença e ajudar na tomada de decisão clínica e, finalmente, auxiliar na pesquisa de terapia. Este trabalho propõe uma framework baseada em algoritmos de regularização logística para seleccionar mutações genéticas. A framework pode ser dividida em 3 secções: primeiro, a integração dos dados, limpeza dos dados e construção de variáveis; segundo, o desenvolvimento de modelos de classificação, selecção de variáveis e análise de variáveis comuns entre grupos de pacientes; terceiro, validar os biomarcadores seleccionados pelo modelo de aprendizagem automática. Hoje em dia, a Unidade de Investigação Patobiologia Molecular do Instituto Português de Oncologia de Lisboa, Francisco Gentil, segue normas internacionais que estabelecem quais os marcadores que devem ser analisados no perfil genético de um paciente. Este trabalho vai contribuir para verificar novos biomarcadores, de uma maneira expedita e construtiva, que estão correlacionados com um risco aumentado de desenvolver cancro do cólon e recto.

Descrição

Palavras-chave

Colorectal Cancer genetic variants germline mutations feature selection machine learning precision medicine

Contexto Educativo

Citação

Projetos de investigação

Unidades organizacionais

Fascículo

Editora

Licença CC