| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 30.5 MB | Adobe PDF |
Autores
Orientador(es)
Resumo(s)
Viral pandemics have profoundly impacted human societies, underscoring the urgent
need for enhanced pandemic preparedness. With limited antiviral treatments, developing
new strategies applicable to various viruses is crucial. Monobodies, small proteins with
unique characteristics, have emerged as promising antiviral candidates. This thesis aims
to create a computational framework streamlining monobody development, positing that
language models can generate a large, diverse monobody library suitable for further
design.
The research began with the 10𝑡 ℎ human FN3 domain, using sequence search and
the MSA Transformer language model to expand the monobody library. Structures
were predicted and docked with the SARS-CoV-2 RBD as proof of concept, followed by
optimization. Interface metrics were calculated to filter promising results. Top-performing
complexes underwent MD simulations, alongside simulations of RBDs from SARS-CoV-2
variants BA.2.86 and JN.1.
Findings showed the MSA Transformer significantly enhanced the selection process for
target-specific antiviral discovery. The most effective approach involved starting from the
predicted docked complex structure, with improvements through optimizing the entire
sequence.
MD simulations revealed highly dynamic RBDs of SARS-CoV-2 variants, particularly
in loop regions. Principal Component Analysis indicated shifts in conformational states,
potentially impacting viral infectivity and immune evasion, emphasizing the importance
of monitoring mutations and their structural consequences.
This research demonstrates that language models can effectively create a large, diverse
monobody library, integrable into a broader antiviral design framework. These advances
could significantly enhance pandemic preparedness by streamlining target-specific antivi-
ral development.
As pandemias virais têm impactado profundamente as sociedades humanas, subli- nhando a necessidade urgente de melhor preparação pandémica. Com tratamentos an- tivirais limitados, é crucial desenvolver novas estratégias aplicáveis a vários vírus. Os monobodies, pequenas proteínas com características únicas, surgiram como promissores candidatos antivirais. Esta tese visa criar uma estrutura computacional que simplifique o desenvolvimento de monobodies, propondo que modelos de linguagem podem gerar uma biblioteca de monobodies grande e diversificada, adequada para design adicional. A investigação começou com o 10º domínio FN3 humano, utilizando pesquisa de sequências e o modelo de linguagem MSA Transformer para expandir a biblioteca de monobodies. As estruturas foram previstas e acopladas com o RBD do SARS-CoV-2 como prova de conceito, seguidas de otimização. Calcularam-se métricas de interface para filtrar resultados promissores. Os complexos com melhor desempenho foram submetidos a simulações de MD, juntamente com simulações de RBDs das variantes BA.2.86 e JN.1 do SARS-CoV-2. Os resultados mostraram que o MSA Transformer melhorou significativamente o pro- cesso de seleção para a descoberta antiviral específica. A abordagem mais eficaz envolveu começar pela estrutura do complexo acoplado previsto, com melhorias através da otimiza- ção de toda a sequência. As simulações de MD revelaram RBDs altamente dinâmicos das variantes do SARS-CoV-2, particularmente nas regiões de loop. A Análise de Componentes Principais indicou mudanças nos estados conformacionais, potencialmente impactando a infecciosidade viral e evasão imune, enfatizando a importância de monitorizar mutações e suas consequências estruturais. Esta investigação demonstra que modelos de linguagem podem criar eficazmente uma biblioteca de monobodies grande e diversificada, integrável num quadro mais amplo de design antiviral. Estes avanços poderão melhorar significativamente a preparação pandémica, agilizando o desenvolvimento de antivirais específicos.
As pandemias virais têm impactado profundamente as sociedades humanas, subli- nhando a necessidade urgente de melhor preparação pandémica. Com tratamentos an- tivirais limitados, é crucial desenvolver novas estratégias aplicáveis a vários vírus. Os monobodies, pequenas proteínas com características únicas, surgiram como promissores candidatos antivirais. Esta tese visa criar uma estrutura computacional que simplifique o desenvolvimento de monobodies, propondo que modelos de linguagem podem gerar uma biblioteca de monobodies grande e diversificada, adequada para design adicional. A investigação começou com o 10º domínio FN3 humano, utilizando pesquisa de sequências e o modelo de linguagem MSA Transformer para expandir a biblioteca de monobodies. As estruturas foram previstas e acopladas com o RBD do SARS-CoV-2 como prova de conceito, seguidas de otimização. Calcularam-se métricas de interface para filtrar resultados promissores. Os complexos com melhor desempenho foram submetidos a simulações de MD, juntamente com simulações de RBDs das variantes BA.2.86 e JN.1 do SARS-CoV-2. Os resultados mostraram que o MSA Transformer melhorou significativamente o pro- cesso de seleção para a descoberta antiviral específica. A abordagem mais eficaz envolveu começar pela estrutura do complexo acoplado previsto, com melhorias através da otimiza- ção de toda a sequência. As simulações de MD revelaram RBDs altamente dinâmicos das variantes do SARS-CoV-2, particularmente nas regiões de loop. A Análise de Componentes Principais indicou mudanças nos estados conformacionais, potencialmente impactando a infecciosidade viral e evasão imune, enfatizando a importância de monitorizar mutações e suas consequências estruturais. Esta investigação demonstra que modelos de linguagem podem criar eficazmente uma biblioteca de monobodies grande e diversificada, integrável num quadro mais amplo de design antiviral. Estes avanços poderão melhorar significativamente a preparação pandémica, agilizando o desenvolvimento de antivirais específicos.
Descrição
Palavras-chave
Monobodies Protein Language Models Antiviral Design Molecular Dynamics Simulations Viral Variants
