Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News

Gusmão, Felipe dos Santos

Use este identificador para citar ou linkar para este item: http://riu.ufam.edu.br/handle/prefix/6934

Tipo de documento:	Trabalho de Conclusão de Curso
Título:	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
Autor(a):	Gusmão, Felipe dos Santos
Orientador(a):	Pio, José Luiz de Souza
metadata.dc.contributor.referee1:	Caldas, Ruiter Braga
metadata.dc.contributor.referee2:	Januário, Francisco de Assis Pereira
Resumo:	O presente trabalho objetiva analisar o desempenho de três modelos de clas- sificação de texto para a identificação de notícias falsas (fake news). Foi de- senvolvido um sistema de classificação de notícias utilizando variações do modelo BERT. Os modelos utilizados foram: BERT, DistilBERT e o BERTimbau. O cenário definido foi analisar 7200 amostras de notícias em português que estão pré-classificadas no corpus Fake.Br em 2 classes, notícias verdadeiras e notícias falsas, com 3600 amostras para cada classe. Foi comparada a per- formance dos 3 modelos para classificação do corpus utilizando as métricas de precisão, acurácia, e F1 de cada um dos modelos. Como esperado, já que é um modelo pré-treinado em português, o modelo BERTimbau apresentou os melhores resultados dentro das métricas avaliadas, obtendo 98% de precisão no segundo experimento.
Resumo em outro idioma:	The present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment.
Palavras-chave:	Fake news BERT DistilBERT BERTimbau
Área de conhecimento - CNPQ:	ENGENHARIAS
Idioma:	por
País de publicação:	Brasil
Faculdade, Instituto ou Departamento:	FT - Faculdade de Tecnologia
metadata.dc.publisher.course:	Engenharia da Computação - Bacharelado - Manaus
Tipo de acesso:	Acesso Aberto
URI:	http://riu.ufam.edu.br/handle/prefix/6934
Vocabulário controlado:	Processamento de linguagem natural (Computação) Inteligência artificial Notícias falsas Desinformação
Aparece nas coleções:	Trabalho de Conclusão de Curso - Graduação - Ciências Exatas e da Terra

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
TCC_FelipeGusmão.pdf		1,08 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item