Na corrida pelos fatos: Pesquisa treina algoritmos para identificar notícias falsas

Na pesquisa “Aplicação de Processamento de Linguagem Natural na Detecção de Notícias Falsas”, Nicollas de Oliveira e Diogo Mattos abordam o desenvolvimento de três metodologias diferentes para a detecção de notícias falsas

Crédito da fotografia: 
Freepik (Divulgação)
Estudo do Departamento de Engenharia de Telecomunicações da UFF utiliza publicações falsas e verdadeiras feitas no X para identificar desinformação

Tema do relatório “Desafios e Estratégias na luta contra a Desinformação Científica”, publicado em junho deste ano pela Academia Brasileira de Ciências (ABC), a desinformação e a propagação de fake news têm sido investigadas mundo afora. Na Universidade Federal Fluminense (UFF), as notícias falsas também são foco de diversos estudos. Nesse sentido, a pesquisa “Aplicação de Processamento de Linguagem Natural na Detecção de Notícias Falsas”, de Nicollas Rodrigues de Oliveira e Diogo Menezes Ferrazzani Mattos, ambos do Programa de Pós-Graduação em Engenharia Elétrica e de Telecomunicações (PPGEET-UFF), aborda o desenvolvimento de três metodologias diferentes para a detecção de notícias falsas, com base na aplicação de algoritmos de Inteligência Artificial (IA) e técnicas de processamento de texto sobre postagens de redes sociais, sobretudo do X (antigo Twitter).

“Analisamos como detectar fake news e o que tem nessas notícias que pode determiná-las como falsas apenas ao olhá-la”, comenta Mattos, professor do PPGEET-UFF e orientador de Oliveira. “Depois vimos que, para conseguir entender como a notícia realmente está se espalhando, como é a dinâmica no mundo virtual, precisávamos olhar também as redes sociais. Ao olhar para elas, observamos a formação de grupos que aumentam a circulação das notícias falsas, funcionando assim como ‘câmaras de eco’ — rede de usuários em que informações, ideias e crenças unilaterais são amplificadas ou reforçadas pelo compartilhamento repetitivo, brindando-os de refutação”, complementa o docente.

Com dois artigos publicados, “A Sensitive Stylistic Approach to Identify Fake News on Social Networking” e “Identifying Fake News on Social Networks Based on Natural Language Processing: Trends and Challenges”, o estudo utilizou um conjunto de aproximadamente 33 mil tweets com informações falsas e verdadeiras para treinar os algoritmos, obtendo um desempenho de detecção de 86% de acurácia e 94% de precisão quando combinadas as duas metodologias propostas. “Existem várias formas de realizar a identificação de notícias falsas. A que usamos foi baseada no texto, então fazíamos uma análise textual para identificar expressões ou até mesmo características que indicassem a falseabilidade da notícia”, explica o doutorando.

Para alcançar uma boa acurácia, o banco de dados é alimentado, preferencialmente, com publicações recentes, a fim de manter o algoritmo atualizado e capaz de acompanhar o desenvolvimento de um evento. “No Rio Grande do Sul, por exemplo, até o início das enchentes tínhamos um número muito elevado de desaparecidos. A princípio, se treinássemos o algoritmo com aquelas notícias, obteríamos que tantas pessoas estavam desaparecidas naquele momento, mas depois esse número estaria incorreto, então precisa haver um processo de retroalimentação e atualização das ferramentas com as notícias verdadeiras. Assim, conseguimos fazer o treinamento contínuo para identificar as informações corretamente ao longo do tempo”.

Identificando informações falsas

Alguns padrões foram identificados nas notícias falsas: o uso constante de palavras com grau de extremismo muito grande, como “jamais” e “nunca”, e de números, para criar um sentimento de grandeza sobre aquelas informações, atraindo o olhar do leitor e levando-o a compartilhar aquela publicação. Outra questão analisada em relação às fake news é que, geralmente, utilizam menos termos e radicais que as publicações verdadeiras. Com isso, se a publicação apresenta quantidade e variedade maiores de palavras, a probabilidade de ser um fato também será maior.

No X, principalmente, muitas publicações falsas apresentaram um espaçamento maior entre as palavras: “Muitas vezes, são pessoas que republicam uma informação e não tem muita prática com digitação, então o espaço sai duplicado, ou não são da área jornalística, não sendo profissionais especializados nisso. Normalmente, são pessoas que adquirirem aquela informação e acham que conseguem reescrever e republicar, só que sem nenhum processo de edição, maquiando-a para ser cada vez mais influente ou instigar outras pessoas a clicarem nela e assim propagá-la cada vez mais”, indica Oliveira.

O perigo da desinformação

Segundo o docente de Engenharia de Telecomunicações, apesar de existirem momentos mais propícios para a propagação de fake news, como períodos eleitorais ou de crise climática, como aconteceu recentemente com as fortes chuvas no Rio Grande do Sul, a busca por maior interação nas mídias sociais potencializa a circulação de desinformação. “Tudo que gera engajamento nas redes sociais leva a notícias falsas, não só momentos de cunho político geram maior divulgação de notícias falsas, mas outros acontecimentos como programas como o Big Brother Brasil, por exemplo, que gera maior movimentação nas redes sociais”, afirma. Para o professor, existem duas vertentes de fake news: uma para causar impacto político e outra, que podem não ser exatamente publicações falsas, mas sensacionalistas ou verdades manipuladas, para gerar engajamento, “visando ao lucro puro e simples da propagação de informações nas redes sociais”.

Ainda de acordo com Mattos, existem vários fatores negativos que as fake news podem gerar, sendo o primeiro deles o fator midiático. “A partir da criação e da popularização delas no meio virtual houve uma inversão, ou pelo menos uma supressão, da importância do processo de mediação. Ou seja, antigamente, tínhamos jornalistas responsáveis pelo processo de publicação, verificação, edição e divulgação de uma notícia, agora percebemos que esse processo de filtragem da informação não ocorre ou não é mais feito por profissionais da área de jornalismo. Houve uma inversão de atores e agora os próprios usuários criam, analisam e filtram as informações, que não necessariamente são verdadeiras”.

Esse acúmulo de notícias falsas, explica o professor, pode prejudicar tanto a indústria jornalística quanto os consumidores de informação, já que as publicações passam a ser acompanhadas de um processo de descredibilização, especialmente quando ligadas a câmaras de eco. “Com isso, põe-se em dúvida bases da sociedade que antes eram muito bem estabelecidas, como a importância da vacinação. Por último, e o que acredito ser mais grave, é pôr em risco a democracia, porque isso tudo leva a um ambiente extremista: mesmo uma notícia sendo esdruxulamente falsa, quanto mais bombardeada, mas verdadeira ela se torna”.

UFF se torna referência no combate à desinformação

Além da pesquisa para detecção de notícias falsas, a UFF inaugurou, em maio, o Centro de Referências para o Ensino do Combate à Desinformação (Codes), a partir de uma iniciativa do Instituto Nacional de Ciência e Tecnologia em Disputas e Soberanias Informacionais (INCT-DSI).

Visando promover a sistematização dos estudos sobre desinformação no país, o Codes é coordenado pelos professores Afonso de Albuquerque e Thaiane Moreira de Oliveira, ambos do Programa de Pós-Graduação em Comunicação da UFF e tem como objetivo elaborar um currículo para os estudos de desinformação no Brasil. A expectativa é de “formulação de diretrizes para a oferta de cursos sobre desinformação, discursos de ódio e teorias da conspiração, buscando respaldo teórico em pesquisas brasileiras, com o intuito de valorizar uma perspectiva soberana sobre o tema”, segundo publicação feita em maio deste ano.

_____

Nicollas Rodrigues de Oliveira é doutorando em Engenharia de Telecomunicações pelo Programa de Pós-Graduação em Engenharia Elétrica e de Telecomunicações da Universidade Federal Fluminense (PPGEET-UFF) e bolsista financiado pela CAPES. Possui mestrado e graduação em Engenharia de Telecomunicações pela Universidade Federal Fluminense (UFF) e foi bolsista de Iniciação Científica pela FAPERJ.

Diogo Menezes Ferrazani Mattos graduou-se em Engenharia de Computação e Informação na Universidade Federal do Rio de Janeiro (UFRJ) e é mestre e doutor em Engenharia Elétrica pelo Programa de Engenharia Elétrica da Universidade Federal do Rio de Janeiro (COPPE-UFRJ). Atualmente, é professor na Universidade Federal Fluminense (UFF) e Jovem Cientista do Nosso Estado (FAPERJ).

Compartilhe