Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10362/118278| Título: | Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições |
| Autor: | Silva, Ana Valeria Vieira da |
| Orientador: | Krippahl, Ludwig |
| Palavras-chave: | anômalas detecção machine learning Autoencoder rede social |
| Data de Defesa: | Fev-2021 |
| Resumo: | As redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como
canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma
política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por
contas com utilizadores humanos ou não humanos.
É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação
propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação
causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido
a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo.
Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos
algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets
publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019.
As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram
selecionadas utilizando a técnica Recursive Feature Elimination.
Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os
modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras
eleições para qualquer país, sendo esta uma inovação proposta por este trabalho.
Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando
globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo
método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência.
A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que
existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições
ocorridas no Brasil e em Portugal.
Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as
contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal.
O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de
Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais
ou anômalas, além da visualização dos clusters gerados a partir destas últimas. Social networks can be used in an environment of political campaigning or elections as an information channel for its users. Twitter’s social network has been used as a political platform in several elections around the world and its political campaigns are coordinated by accounts with human or non-human users. It is essential to discern the activity of normal anomalous accounts, as the information propagated by the network can have several objectives, including disinformation. The disinformation caused by anomalous accounts is more likely to reach the social network due to the high number of accounts that can be linked to this same objective. This dissertation uses two models to detect anomalous accounts based on the SVM one-class and Autoencoder Ensembles algorithms. The study used real data as recently elections occurred in Brazil in 2018 and Portugal in 2019. The features of Twitter’s social network were important in the analysis of the user's profile and were selected using the Recursive Feature Elimination technique. Only information from previously known normal accounts was used to train unsupervised learning models, which allows the models to be reused in other elections for any country, this being an innovation proposed by this work. Both models made it possible to detect anomalous accounts in the test data, presenting overall good performance in their results. The Autoencoder Ensembles was developed by the ensembles method from the value of the reconstruction error with training in sequence. From the detection of anomalous accounts, clusters were created and it is possible to verify that there is a difference in the political discourse published by anomalous accounts through tweets in the elections that took place in Brazil and Portugal. The actual data was taken from the Twitter developer API, which enabled the access to active accounts during the electoral period in 2018 in Brazil and 2019 in Portugal. The objective of this dissertation was to contribute to the growing study in the field of Information Systems that use machine learning techniques and neural networks to detect real or anomalous accounts, in addition to visualizing the clusters generated from these latter. |
| URI: | http://hdl.handle.net/10362/118278 |
| Designação: | Análise e Engenharia de Big Data |
| Aparece nas colecções: | FCT: DI - Dissertações de Mestrado |
Ficheiros deste registo:
| Ficheiro | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Silva_2020.pdf | 2,64 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.











