Nascimento, SusanaLopes, MartaOliveira, Manuel Bernardo Ribeiro de2024-05-032024-05-032023-12http://hdl.handle.net/10362/166940The production and harvest of shellfish is threatened by harmful algal bloom events that can contaminate these filter-feeding organisms with marine biotoxins. Several studies have been carried out on this topic, but harmful algal blooms are a complex phenomena that still require further investigation to better understand its occurrence and its impact on shellfish contamination. After studies in the Portuguese mainland coast regarding shellfish contamination by marine biotoxins and coastal upwelling recognition through remotely sensed sea surface temperature images, this dissertation aims at broadening the knowledge on this area by studying shellfish contamination in several shellfish production regions in the Portuguese coast and assessing the role on this phenomenon of several environmental drivers including meteorological, hydrodynamic, water properties and coastal upwelling variables. Combining data acquired from previous works and partner institutions, this dissertation focuses on developing an appropriate experimental protocol capable of constructing several machine learning models capable of predicting shellfish contamination, exploring different approaches and algorithms. The work developed included an initial data preprocessing and analysis stage, that merged the data from distinct spatio-temporal sources and selected the best regions and variables. The models for shellfish contamination prediction were developed considering both classification and regression approaches, exploring the predictions as contamination classes or as biotoxin concentration levels. The algorithms used in this work, Random Forest and Support Vector Machine, were selected due to adequacy of their characteristics to the problem and past uses in the literature. The classification approach proved the most successful, correctly predicting most shellfish contamination data cases across the different zones. The inclusion of environmental variables in various combinations proved beneficial for certain models and regions.A produção de bivalves é ameaçada pela proliferação de algas nocivas, que podem conta- minar estes animais filtradores com biotoxinas marinhas. Vários estudos têm explorado este tópico, porém, é um fenómeno complexo, cuja ocorrência e impacto na contaminação de bivalves não são completamente compreendidos. Seguindo estudos realizados na costa Portuguesa relativos à contaminação de bivalves e ao reconhecimento do afloramento costeiro através de imagens remotamente obtidas da temperatura da superfície do mar, esta dissertação procura aumentar o conhecimento nesta área através do estudo da con- taminação de bivalves em diversas regiões de produção de bivalves na costa portuguesa e avaliar o impacto de diferentes factores ambientais incluindo váriaveis meteorológicas, hidrodinâmicas, de propriedades da água e do afloramento costeiro. Combinando os dados adquiridos de trabalhos anteriores e instituições parceiras, esta dissertação foca-se em desenvolver um protocolo experimental apropriado capaz de construir vários modelos de aprendizagem automática capazes de prever a contaminação de bivalves, explorando diversas abordagens e algoritmos. O trabalho desenvolvido incluiu uma fase inicial de pré-processamento e análise de dados, que juntou dados de diferentes fontes espaci- otemporais e selecionou as melhores regiões e variáveis. Os modelos de previsão da contaminação de bivalves foram desenvolvidos tendo em consideração abordagens de classificação e regressão, explorando as previsões como classes de contaminação ou como níveis de concentração de biotoxinas. Os algoritmos utilizados neste trabalho, Floresta Aleatória e Máquina de Vetores de Suporte, foram selecionados devido à adequação das suas características ao problema e ao seu uso na literatura explorada. A abordagem de classificação demonstrou ser melhor sucedida, prevendo correctamente a maioria das amostras de contaminação de bivalves nas diferentes regiões. A introdução de variáveis ambientais em diversas combinações provou ser benéfico para certos modelos e regiões.engShellfish ContaminationEnvironmental DriversRandom ForestSupport Vector MachineEvaluating the role of environmental variables on shellfish biotoxin contamination via supervised learningmaster thesis