Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10362/177201
Título: | Associação entre priming com gelatina e hemorragia pós-operatória em cirurgia cardíaca: uma abordagem com modelos de regressão binária em dados não balanceados |
Autor: | Pereira, Rafael Maniés |
Orientador: | Natário, Isabel |
Palavras-chave: | Modelos Lineares Generalizados Modelos de Regressão Binária Regressão log-log complementar Balanceamento de Dados Gelatina Priming |
Data de Defesa: | Mai-2024 |
Resumo: | O objetivo deste trabalho foi investigar se o
priming com gelatina está associado a um
aumento da hemorragia pós-operatória, após cirurgia cardíaca com Circulação Extracorporal
(CEC), em adultos. Para tal, realizou-se um estudo do tipo observacional, retrospetivo, num
único centro cirúrgico.
A regressão binária pode ser estimada como um modelo linear generalizado,
aplicando-se a uma variável de resposta binária. A função de regressão
log-log complementar
é uma alternativa de função de ligação utilizada, por exemplo, quando a probabilidade de um
evento é muito pequena. Não são expectáveis dados balanceados na maioria das variáveis de
interesse aplicadas às Ciências da Saúde. Como tal, existem técnicas de balanceamento, sendo
que algumas utilizam a repetição, por aleatorização, de casos da classe minoritária. É o caso
da técnica de
oversampling.
Foram ajustados três modelos de regressão binária, aplicados a cada uma das bases de
dados: (i) original; (ii) parcialmente balanceada; e (iii) completamente balanceada. O modelo
que obteve o menor valor de AIC, corrigido à dimensão da amostra, foi o segundo. Os
resultados sugerem que, os modelos estimados a partir de bases de dados balanceados
proporcionaram melhorias significativas na capacidade de precisão na classificação. Contudo,
o modelo com dados completamente balanceados não mostrou ser adequado em termos de
deviance, pelo que poderá ter sido adicionada demasiada complexidade ao modelo. De um
modo geral, os resultados sugerem que não existe evidência de que a presença de gelatina no
priming esteja associada a um aumento da hemorragia, quer do ponto de vista quantitativo,
quer do ponto de vista do aumento da probabilidade predita para a sua ocorrência.
Por fim, este trabalho realça o desafio no tratamento das bases de dados reais e
aplicadas às áreas da saúde, nomeadamente em dados não balanceados, que tendem a
condicionar sobre ajustamento nos modelos estimados. This study aimed to investigate whether priming with gelatin is associated with an increased risk of postoperative bleeding after cardiac surgery with Extracorporeal Circulation (ECC) in adults. For that, an observational and retrospective study was conducted at a single surgical center. A binary regression can be estimated through generalized linear models, applied to a binary response variable. The complementary log-log regression function is an alternative link function used, for example, when the probability of an event is very small. Balanced data are not expected in most variables of interest in Health Sciences. As such, there are balancing techniques, some of which involve repeating cases from the minority class, by randomization. The oversampling technique exemplifies this. Three binary regression models were adjusted for each database: (i) original; (ii) partially balanced; and (iii) completely balanced. The model with the lowest AIC value, adjusted for sample size, was the partially balanced model. The results suggest that models estimated from balanced databases significantly improved classification accuracy. However, the model with completely balanced data was not suitable in terms of deviance, suggesting that too much complexity may have been added to the model. Overall, the results suggest that there is no evidence that gelatin in priming is associated with an increase in bleeding, both quantitatively and in terms of increased predicted probability for its occurrence. Finally, this work highlights the challenge of managing real databases within the healthcare domain, especially when dealing with unbalanced data. Such Imbalances often lead to overfitting in the models estimated. |
URI: | http://hdl.handle.net/10362/177201 |
Designação: | MESTRADO EM ESTATÍSTICA PARA A SAÚDE |
Aparece nas colecções: | FCT: DM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Pereira_2024.pdf | 5 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.