Use este identificador para citar ou linkar para este item: http://riu.ufam.edu.br/handle/prefix/6934
Tipo de documento: Trabalho de Conclusão de Curso
Título: Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
Autor(a): Gusmão, Felipe dos Santos
Orientador(a): Pio, José Luiz de Souza
metadata.dc.contributor.referee1: Caldas, Ruiter Braga
metadata.dc.contributor.referee2: Januário, Francisco de Assis Pereira
Resumo: O presente trabalho objetiva analisar o desempenho de três modelos de clas- sificação de texto para a identificação de notícias falsas (fake news). Foi de- senvolvido um sistema de classificação de notícias utilizando variações do modelo BERT. Os modelos utilizados foram: BERT, DistilBERT e o BERTimbau. O cenário definido foi analisar 7200 amostras de notícias em português que estão pré-classificadas no corpus Fake.Br em 2 classes, notícias verdadeiras e notícias falsas, com 3600 amostras para cada classe. Foi comparada a per- formance dos 3 modelos para classificação do corpus utilizando as métricas de precisão, acurácia, e F1 de cada um dos modelos. Como esperado, já que é um modelo pré-treinado em português, o modelo BERTimbau apresentou os melhores resultados dentro das métricas avaliadas, obtendo 98% de precisão no segundo experimento.
Resumo em outro idioma: The present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment.
Palavras-chave: Fake news
BERT
DistilBERT
BERTimbau
Área de conhecimento - CNPQ: ENGENHARIAS
Idioma: por
País de publicação: Brasil
Faculdade, Instituto ou Departamento: FT - Faculdade de Tecnologia
metadata.dc.publisher.course: Engenharia da Computação - Bacharelado - Manaus
Tipo de acesso: Acesso Aberto
URI: http://riu.ufam.edu.br/handle/prefix/6934
Vocabulário controlado: Processamento de linguagem natural (Computação)
Inteligência artificial
Notícias falsas
Desinformação
Aparece nas coleções:Trabalho de Conclusão de Curso - Graduação - Ciências Exatas e da Terra

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC_FelipeGusmão.pdf1,08 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.