Logo do repositório
 
Publicação

Diagnosis and prognosis disease biomarkers on critically ill patients with COVID-19 towards a precision medicine - a machine learning approach

datacite.subject.fosCiências Médicas
dc.contributor.advisorBento, Luís
dc.contributor.advisorCalado, Cecília
dc.contributor.authorAraújo, Rúben
dc.date.accessioned2026-05-04T14:35:31Z
dc.date.available2026-05-04T14:35:31Z
dc.date.issued2026-04-20
dc.description.abstractRESUMO: A pandemia provocada pelo COVID-19 (do inglês COVID-19 – Coronavirus Disease 2019) serviu de aviso sobre a fragilidade inerente dos sistemas de saúde globais, tendo perturbado de forma significativa e global, equilíbrios sociais, económicos e estruturas organizacionais clínicas. Esta crise evidenciou a necessidade de desenvolver biomarcadores robustos, com utilidade diagnóstica e prognóstica, para melhor orientar decisões clínicas, especialmente em contextos de unidades de cuidados intensivos (do inglês ICUs – Intensive Care Units). Embora o foco principal desta tese tenha sido a COVID-19, foram exploradas estratégias de descoberta de biomarcadores em condições clínicas distintas, incluindo infeção, mortalidade e delirium, com o objetivo de avaliar o seu potencial de generalização em doentes com COVID-19 internados em unidades de cuidados intensivos, independentemente da patologia subjacente. O trabalho aqui apresentado baseou-se na utilização de técnicas ómicas, nomeadamente a espectroscopia de infravermelho com transformada de Fourier (do inglês FTIRS – Fourier-Transform Infrared Spectroscopy), permitindo caracterizar o estado bioquímico do organismo no momento da colheita da amostra, através da medição de sinais provenientes de proteínas, lípidos, metabolitos e, em menor grau, ácidos nucleicos. Foi também aplicada uma abordagem direcionada à caracterização proteómica de citocinas, com recurso a métodos estatísticos e de aprendizagem automática (do inglês ML – Machine Learning) para identificar biomarcadores clinicamente relevantes em doentes com COVID-19 internados em unidades de cuidados intensivos. A metodologia adoptada baseou-se numa robustez analítica, aplicabilidade prática e possibilidade de implementação futura em diferentes coortes, com ferramentas automáticas acessíveis a todos, incluindo indivíduos sem formação prévia em programação, matemática ou estatística. As duas principais linhas de investigação focaram-se na identificação de biomarcadores para (i) diagnóstico de infeção e (ii) prognóstico de mortalidade. O uso de espectroscopia de infravermelho com transformada de Fourier permitiu desenvolver modelos especializados na deteção de infeção, incluindo a discriminação entre doentes infectados e não infectados, diferenciação entre infeções bacterianas e fúngicas, identificação do local de infeção, classificação por Gram e, inclusivé, uma identificação preliminar ao nível da estirpe. Paralelamente, os perfis de citocinas obtidos por ensaios multiplex, especialmente quando explorados através do uso de rácios complexos, permitiram a discriminação do estado de infeção em doentes de unidades de cuidados intensivos—incluindo a diferenciação por etiologia, local de infeção e classificação de Gram—e o desenvolvimento de modelos preditivos de mortalidade, permitindo superar indicadores tradicionais de cuidados intensivos, como o APACHE II (do inglês – Acute Physiology and Chronic Health Evaluation II), SAPS II (do inglês – Simplified Acute Physiology Score II) e SOFA (do inglês – Sequential Organ Failure Assessment), bem como métricas simples baseadas em concentrações individuais de citocinas. Estes resultados reforçam o benefício em combinar técnicas metabolómicas e proteómicas como ferramentas complementares para melhorar simultaneamente a sensibilidade e a interpretação contextual de biomarcadores em cuidados intensivos. Objectivos secundários incluíram a comparação entre o soro e plasma para aplicações em espectroscopia de infravermelho por transformada de Fourier, identificação de biomarcadores associados ao delirium e desenvolvimento de uma plataforma digital para automatizar projectos de investigação biomédica. O soro e o plasma apresentaram perfis espectrais distintos mas complementares. O plasma pode oferecer vantagens em determinados contextos de investigação, dependendo dos objectivos analíticos. Por sua vez, o soro oferece maior estabilidade de sinal, razão pela qual foi usado ao longo da tese—pelas melhores propriedades de conservação a longo prazo e ausência de interferência causada por fatores de coagulação. A espectroscopia de infravermelho por transformada de Fourier foi ainda utilizada na identificação de potenciais biomarcadores de delirium em doentes com COVID-19 internados em unidades de cuidados intensivos, alcançando métricas de classificação elevadas numa população clinicamente complexa. Por fim, foi desenvolvida a ferramenta ArsHive para apoiar a investigação biomédica através de uma plataforma intuitiva e acessível, que integra preprocessamento de dados, normalização, análise multivariada e aprendizagem automática, produzindo resultados prontos para publicação. Estes contributos adicionais reforçam o potencial de translação dos principais resultados desta tese e com eles promover uma adopção mais abrangente de abordagens baseadas em tecnologias ómicas, por forma a responder tanto aos constrangimentos em investigação como às exigências da prática clínica.por
dc.description.abstractABSTRACT: The Coronavirus Disease 2019 (COVID-19) pandemic served as a stark reminder of the fragility of global healthcare systems, disrupting societal, economic, and clinical frameworks worldwide. It underscored the urgency of developing robust diagnostic and prognostic biomarkers to better guide clinical decisions, particularly in Intensive Care Units (ICUs). While this thesis focused primarily on COVID-19 patients, it explored biomarker discovery strategies across clinically distinct conditions, including infection, mortality, and delirium, to assess their potential generalizability within intensive care unit (ICU) COVID-19 patient settings, regardless of underlying pathology. The work presented in this thesis leveraged omics technologies, namely biochemical fingerprinting (commonly referred to as metabolic fingerprinting), through Fourier-transform infrared spectroscopy (FTIRS), which captures the overall biochemical state of the sample by measuring signals from proteins, lipids, metabolites and, to a lesser extent, nucleic acids. Targeted proteomic cytokine profiling was likewise applied, alongside advanced statistical and machine learning (ML) methods to identify clinically relevant biomarkers in ICU COVID-19 patients. Methodological emphasis was placed on analytical robustness, future cross-cohort implementation, and practical applicability through automated tools designed to be accessible to non-specialists, including researchers who may not have formal training in coding, mathematics, or statistics. The two primary lines of investigation were set on the identification of biomarkers for (i) infection diagnostics and (ii) mortality prognostics. FTIRS-based serum biochemical fingerprinting enabled high-performing models for infection detection, including discrimination between infected and non-infected patients, bacterial versus fungal etiology, infection site, Gram classification, and even preliminary species-level identification. In parallel, cytokine panels obtained through a targeted proteomic approach, particularly when explored through complex ratio modeling, enabled both the discrimination of infection status in ICU patients—including differentiation by etiology, infection site, and Gram classification—and the development of mortality prediction models that consistently outperformed traditional ICU scores such as the Acute Physiology and Chronic Health Evaluation II (APACHE II), Simplified Acute Physiology Score II (SAPS II), and Sequential Organ Failure Assessment (SOFA), as well as simple cytokine metrics. These findings support the value of combining metabolic fingerprinting and targeted proteomics, as complementary tools, to improve both sensitivity and contextual interpretation of biomarker-based assessments in critical care. Secondary goals included the evaluation of serum and plasma for Fourier Transform Infrared Spectroscopy (FTIRS) applications, the discovery of biomarkers associated with delirium, and the development of a computational framework to streamline biomedical data workflows. Serum and plasma exhibited distinct yet complementary spectral profiles. Plasma may offer advantages in specific research contexts, depending on the analytical goals, whereas serum offers enhanced signal stability and was ultimately used throughout the thesis due to its improved long-term storage properties and lack of interference from coagulation factors. FTIRS was also applied in a novel context to identify potential biomarkers of delirium in ICU COVID-19 patients, achieving strong classification metrics in a complex clinical population. Finally, the ArsHive tool was developed to support biomedical research through a user-friendly platform that integrates data curation, normalization, multivariate analysis, and machine learning while producing publication-ready outputs. These secondary achievements further reinforce the translational potential of the main findings and contribute to the broader adoption of omics-driven analytics in clinical and research settings.por
dc.identifier.tid101730659
dc.identifier.urihttp://hdl.handle.net/10362/202796
dc.language.isoeng
dc.relationPredictive Models of COVID-19 Outcomes for Higher Risk Patients Towards a Precision Medicine
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectIntensive Care Unit
dc.subjectCOVID-19
dc.subjectBiomarkers
dc.subjectFTIRS
dc.subjectCytokines
dc.subjectMachine Learning
dc.subjectInfection Diagnostics
dc.subjectMortality Prediction
dc.subjectClinical Decision Support
dc.subjectPrecision Medicine
dc.titleDiagnosis and prognosis disease biomarkers on critically ill patients with COVID-19 towards a precision medicine - a machine learning approachpor
dc.typedoctoral thesis
dspace.entity.typePublication
oaire.awardNumberDSAIPA/DS/0117/2020
oaire.awardTitlePredictive Models of COVID-19 Outcomes for Higher Risk Patients Towards a Precision Medicine
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/AI 4 COVID-19: Ciência dos Dados e Inteligência Artificial na Administração Pública para reforçar o combate à COVID 19 e futuras pandemias - 2020/DSAIPA%2FDS%2F0117%2F2020/PT
oaire.fundingStreamAI 4 COVID-19: Ciência dos Dados e Inteligência Artificial na Administração Pública para reforçar o combate à COVID 19 e futuras pandemias - 2020
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
relation.isProjectOfPublication31030d21-cc24-4714-afd4-0753aace022c
relation.isProjectOfPublication.latestForDiscovery31030d21-cc24-4714-afd4-0753aace022c
thesis.degree.nameBiomedicina

Ficheiros

Principais
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
2. Tese Doutoramento em Biomedicina.pdf
Tamanho:
94.76 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
348 B
Formato:
Item-specific license agreed upon to submission
Descrição: