{"id":52810,"date":"2021-09-30T11:06:41","date_gmt":"2021-09-30T14:06:41","guid":{"rendered":"https:\/\/www.eldorado.org.br\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/"},"modified":"2022-03-03T16:22:41","modified_gmt":"2022-03-03T19:22:41","slug":"entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp","status":"publish","type":"post","link":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/","title":{"rendered":"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning &#8211; Natural Language Processing (NLP)"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">As not\u00edcias falsas, do ingl\u00eas fake news, como s\u00e3o amplamente conhecidas, t\u00eam causado grande in\ufb02u\u00eancia na sociedade, na maioria das vezes, in\ufb02u\u00eancia negativa. De acordo com a an\u00e1lise de H.Ahmed, I.Traore e S.Saad [1], fake news \u00e9 um fen\u00f4meno que tem impactado signi\ufb01cativamente a nossa vida social, em particular no mundo da pol\u00edtica. A exemplo do que aconteceu nas elei\u00e7\u00f5es presidenciais dos EUA no ano de 2016, aqui no Brasil, tamb\u00e9m vivenciamos essa manifesta\u00e7\u00e3o em larga escala nas elei\u00e7\u00f5es presidenciais ocorridas no ano de 2018. Em ambos os casos, muito ainda se discute, internacionalmente, sobre o fato de as tais not\u00edcias terem ou n\u00e3o in\ufb02uenciado diretamente nos resultados \ufb01nais das elei\u00e7\u00f5es. Outro problema grave fomentado pelas not\u00edcias mentirosas \u00e9 o aumento do discurso de \u00f3dio online. De acordo com o que foi publicado pela BBC News Brasil em [9] \u201cDetection of online fake news using n-gram analysis and machine learning techniques\u201d, o Minist\u00e9rio P\u00fablico Federal Brasileiro em coopera\u00e7\u00e3o com a ONG SaferNet, que mant\u00e9m dispon\u00edvel o site denuncie.org.br, v\u00eam recebendo um crescente n\u00famero de den\u00fancias de xenofobia, homofobia, neonazismo, racismo, intoler\u00e2ncia religiosa, etc. Muito se especula tamb\u00e9m com rela\u00e7\u00e3o ao impacto das not\u00edcias enganosas na \u00e1rea de sa\u00fade, onde podemos observar um aumento bastante signi\ufb01cativo durante o per\u00edodo de pandemia do Coronav\u00edrus, o que levou o Minist\u00e9rio da Sa\u00fade Brasileiro a lan\u00e7ar um canal, via whatsapp, onde a popula\u00e7\u00e3o pode encaminhar uma not\u00edcia que trate de sa\u00fade, e o portal responde com um selo o\ufb01cial identi\ufb01cando se a not\u00edcia \u00e9 verdade ou mentira [8]. Este amplo crescimento da prolifera\u00e7\u00e3o de not\u00edcias falsas via internet e seu impacto, nem sempre positivo, tem atra\u00eddo a aten\u00e7\u00e3o de pesquisadores pelo mundo todo.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Devido \u00e0 sua natureza atrativa, as not\u00edcias falsas se espalham rapidamente, in\ufb02uenciando o comportamento das pessoas, a\ufb01rma S. Vosoughi, D. Roy, and S. Aral [6]. Produtos, servi\u00e7os, marcas, regi\u00f5es, pessoas, etc. s\u00e3o severamente prejudicadas por publica\u00e7\u00f5es falsas. Uma pesquisa realizada em 27 pa\u00edses, nos meses de Junho e Julho\/2018, aponta o Brasil em primeiro lugar entre os pa\u00edses onde as pessoas mais acreditam em fake news, tendo 62% da sua popula\u00e7\u00e3o admitido j\u00e1 ter, em algum momento, acreditado em alguma not\u00edcia falsa, conforme D. Cersosimo [2]. Este mesmo \u00edndice foi divulgado em 2016 em uma pesquisa realizada com a popula\u00e7\u00e3o norte-americana, por J. Gottfried and E. Shearer [3]. Os n\u00fameros demonstram que a maioria do p\u00fablico geral n\u00e3o est\u00e1 capacitado para identi\ufb01car, com precis\u00e3o, informa\u00e7\u00f5es enganosas, muitas vezes acredita que uma not\u00edcia verdadeira \u00e9 falsa e vice-versa, \ufb01cando assim suscet\u00edvel a formar suas opini\u00f5es com base em informa\u00e7\u00f5es err\u00f4neas. Todos estes fatos evidenciam que \u00e9 necess\u00e1rio oferecer recursos para combater a prolifera\u00e7\u00e3o de not\u00edcias falsas e\/ou que apoiem a popula\u00e7\u00e3o na identi\ufb01ca\u00e7\u00e3o das mesmas, mas para isto h\u00e1 muito trabalho a ser feito.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">De acordo com R. A. Monteiro, R. L. S. Santos, T. A. S. Pardo, T. A. de Almeida, E. E. S. Ruiz, and O. A. Vale [5], esfor\u00e7os acad\u00eamicos v\u00eam sendo aplicados para identi\ufb01car como estas not\u00edcias se espalham, o comportamento dos usu\u00e1rios que as produzem e dos que as l\u00eaem, as caracter\u00edsticas da linguagem utilizada, etc. cujo objetivo \u00e9 poder identi\ufb01car tais not\u00edcias. Um dos recursos utilizado nestes esfor\u00e7os \u00e9 o processamento de linguagem natural (PLN), que \u00e9 uma sub\u00e1rea da intelig\u00eancia arti\ufb01cial que busca preencher a lacuna entre a comunica\u00e7\u00e3o humana e o entendimento dos computadores ajudando a entender e interpretar a linguagem humana.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Neste contexto, \ufb01cou clara a urg\u00eancia da necessidade de intensi\ufb01car as pesquisas e disponibilizar tecnologias para desacelerar a prolifera\u00e7\u00e3o deste tipo de not\u00edcias e apoiar os usu\u00e1rios de internet a identi\ufb01car fontes con\ufb01\u00e1veis para obten\u00e7\u00e3o de informa\u00e7\u00e3o. Decidiu-se realizar esta pesquisa utilizando-se do conceito de l\u00f3gica difusa atrav\u00e9s do c\u00e1lculo de similaridade para a detec\u00e7\u00e3o autom\u00e1tica de fake news publicadas na l\u00edngua portuguesa.\u00a0<\/span><\/p>\n<p><b>T\u00e9cnicas Utilizadas\u00a0<\/b><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-50676 aligncenter\" src=\"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1985720861-1-300x164.jpg\" alt=\"\" width=\"693\" height=\"379\" srcset=\"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1985720861-1-300x164.jpg 300w, https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1985720861-1-768x421.jpg 768w, https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1985720861-1.jpg 1000w\" sizes=\"auto, (max-width: 693px) 100vw, 693px\" \/><\/p>\n<p><span style=\"font-weight: 400;\">A categoriza\u00e7\u00e3o de textos \u00e9 uma t\u00e9cnica usada em PLN que permite a de\ufb01ni\u00e7\u00e3o autom\u00e1tica de categorias, bem como a classi\ufb01ca\u00e7\u00e3o de um conjunto de documentos nessas classes. Desta forma, quando se tem a necessidade de buscar um documento, ou conte\u00fado, o espa\u00e7o de busca \u00e9 reduzido facilitando o acesso de quem busca \u00e0 informa\u00e7\u00e3o, pois ao inv\u00e9s de selecionar um documento entre milhares diferentes, pode-se analisar apenas os documentos pertencentes \u00e0s categorias de interesse. Neste contexto, a categoriza\u00e7\u00e3o de textos foi usada em combina\u00e7\u00e3o com a aprendizagem de m\u00e1quina supervisionada que, de acordo com T. Mitchell [4], consiste em ensinar ao computador, com base em pares de perguntas e respostas conhecidas que s\u00e3o apresentados a ele, como encontrar a resposta para uma entrada desconhecida, por\u00e9m do mesmo contexto das que foram utilizadas para ensin\u00e1-lo.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Um sistema de categoriza\u00e7\u00e3o de textos compreende duas fases: de\ufb01ni\u00e7\u00e3o das categorias e classi\ufb01ca\u00e7\u00e3o de novos documentos nas categorias pr\u00e9-de\ufb01nidas. A fase de de\ufb01ni\u00e7\u00e3o das categorias, normalmente, \u00e9 realizada em tr\u00eas etapas: prepara\u00e7\u00e3o de textos, sele\u00e7\u00e3o de caracter\u00edsticas e de\ufb01ni\u00e7\u00e3o das categorias.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">O prot\u00f3tipo desenvolvido nesta pesquisa implementa a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News, chamada DAFN, sob uma cole\u00e7\u00e3o de not\u00edcias em l\u00edngua portuguesa criada por R. A. Monteiro, R. L. S. Santos, T. A. S. Pardo, T. A. de Almeida, E. E. S. Ruiz, and O. A. Vale [5].\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Os textos da cole\u00e7\u00e3o foram obtidos a partir dos sites de jornais e revistas, aplicativos de comunica\u00e7\u00e3o, sites de checagem de fatos e redes sociais, do per\u00edodo relativo aos anos de 2017 e 2018. A cole\u00e7\u00e3o totaliza 7200 documentos, sendo que cada categoria cont\u00e9m 3600 not\u00edcias. Parte dessa cole\u00e7\u00e3o foi usada para de\ufb01nir as categorias, considerando 3240 textos de cada categoria. O restante da cole\u00e7\u00e3o, ou seja 720 not\u00edcias, sendo 360 not\u00edcias falsas e 360 not\u00edcias verdadeiras, foram usadas para testes do processo de DAFN implementado.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">O prot\u00f3tipo realiza a DAFN atrav\u00e9s da t\u00e9cnica de categoriza\u00e7\u00e3o de textos nas fases e etapas descritas acima.<\/span><\/p>\n<p><b>Prepara\u00e7\u00e3o do Texto\u00a0<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Para a prepara\u00e7\u00e3o do texto, o prot\u00f3tipo implementa as t\u00e9cnicas de identi\ufb01ca\u00e7\u00e3o de termos, remo\u00e7\u00e3o de caracteres inv\u00e1lidos, e remo\u00e7\u00e3o de stopwords.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">O processo de prepara\u00e7\u00e3o de texto ocorre da seguinte maneira: sobre uma base de documentos conhecidos e pertencentes a uma mesma classe, cada um dos textos \u00e9 apresentado ao prot\u00f3tipo que ent\u00e3o faz a identi\ufb01ca\u00e7\u00e3o de cada termo individualmente, removendo os caracteres especiais e os n\u00fameros.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Logo ap\u00f3s, realiza-se a convers\u00e3o de todas as letras por sua correspondente mai\u00fascula e eliminam-se as acentua\u00e7\u00f5es. Esse processo, al\u00e9m de evitar que palavras iguais sejam consideradas diferentes por estarem em caixa alta ou baixa, minimiza em parte o problema dos erros ortogr\u00e1ficos quanto \u00e0 acentua\u00e7\u00e3o, visto que desconsidera o uso de acentos.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Em seguida s\u00e3o eliminadas as palavras que n\u00e3o s\u00e3o pass\u00edveis de serem representantes de alguma categoria e s\u00e3o conhecidas como stop words ou palavras negativas e podem ser representadas por artigos, pronomes, preposi\u00e7\u00f5es, adv\u00e9rbios e outras palavras que se apresentem com elevada ou baixa frequ\u00eancia nos textos.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Para realizar esta tarefa, deve-se elaborar uma lista com todas as stopwords referentes ao dom\u00ednio que o sistema dever\u00e1 tratar. Essa lista \u00e9 chamada de stoplist. Para efetuar a remo\u00e7\u00e3o das stop words do texto, o sistema compara cada palavra presente no texto com as da stoplist. Caso o termo esteja presente na lista, ele \u00e9 exclu\u00eddo do texto.\u00a0<\/span><\/p>\n<p><b>Sele\u00e7\u00e3o de Caracter\u00edsticas<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Depois de conclu\u00eddo o processo de prepara\u00e7\u00e3o do texto, a tarefa \u00e9 de\ufb01nir o conjunto de termos que melhor representem o assunto a ser categorizado, ou seja, encontrar as palavras ou conceitos que podem de\ufb01nir uma categoria. Esta etapa \u00e9 chamada de sele\u00e7\u00e3o de caracter\u00edsticas e este conjunto de termos tamb\u00e9m \u00e9 reconhecido por \u00edndice representativo da categoria.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Para esta fase, a t\u00e9cnica escolhida para ser aplicada pelo prot\u00f3tipo, atribui a import\u00e2ncia de cada termo dentro do contexto, \u00e9 denominada escore de relev\u00e2ncia. Identi\ufb01car a relev\u00e2ncia do termo \u00e9 essencial para an\u00e1lise de similaridade visto que diferentes assuntos podem possuir termos iguais como sendo relevantes, por\u00e9m com graus de import\u00e2ncia diferentes.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">A ideia desta t\u00e9cnica est\u00e1 baseada na frequ\u00eancia de um termo em uma categoria e na sua frequ\u00eancia nas demais categorias, neste caso as categorias s\u00e3o de not\u00edcia falsa ou verdadeira. A partir destes dados \u00e9 calculada a relev\u00e2ncia do termo para uma dada categoria. Naquela(s) categoria(s) em que o termo alcan\u00e7ar um escore de relev\u00e2ncia maior ele ent\u00e3o ser\u00e1 escolhido para represent\u00e1-la(s).\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Para a cria\u00e7\u00e3o do \u00edndice, adotou-se a t\u00e9cnica de truncagem, que \u00e9 o ato de cortar uma parte de um todo. Para a realiza\u00e7\u00e3o da truncagem, calcula-se a import\u00e2ncia dos termos do texto e os ordena por este valor. Logo ap\u00f3s, \u00e9 estabelecido o limite m\u00e1ximo de caracter\u00edsticas a compor o \u00edndice da categoria.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Nesta etapa de sele\u00e7\u00e3o das caracter\u00edsticas aplicou-se tamb\u00e9m o m\u00e9todo de valida\u00e7\u00e3o cruzada, em resumo esse m\u00e9todo consiste em dividir a cole\u00e7\u00e3o de textos em conjuntos iguais, neste caso a cole\u00e7\u00e3o foi dividida em 5 conjuntos por terem sido alcan\u00e7ados melhores resultados com esta quantidade. Ent\u00e3o usou-se 4 partes para fazer a sele\u00e7\u00e3o das caracter\u00edsticas das categorias e 1 parte para testes, para permitir avaliar o quanto o prot\u00f3tipo consegue generalizar para not\u00edcias ainda n\u00e3o conhecidas, esse processo foi repetido 5 vezes.\u00a0<\/span><\/p>\n<p><b>Etapa de Categoriza\u00e7\u00e3o<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Nesta etapa do processo \u00e9 executada a categoriza\u00e7\u00e3o de novas not\u00edcias. Para qual o prot\u00f3tipo usa a t\u00e9cnica de similaridade por l\u00f3gica difusa, apresentada por L. K. Wives. [7], que permite efetuar a categoriza\u00e7\u00e3o graduada de uma not\u00edcia para uma ou mais categorias.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">A l\u00f3gica difusa, do ingl\u00eas Fuzzy Logic, pode ser de\ufb01nida como sendo uma ferramenta capaz de capturar informa\u00e7\u00f5es vagas, em geral descritas em uma linguagem natural e convert\u00ea-las para um formato num\u00e9rico o que torna f\u00e1cil a manipula\u00e7\u00e3o por computadores. Escolheu-se esta t\u00e9cnica por n\u00e3o terem sido encontrados muitos relatos de utiliza\u00e7\u00e3o da l\u00f3gica difusa para categoriza\u00e7\u00e3o autom\u00e1tica de documentos de texto.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">A partir da aplica\u00e7\u00e3o desta t\u00e9cnica cada vez que um termo \u00e9 encontrado em ambos os \u00edndices, da categoria e do novo texto, aplica-se o c\u00e1lculo do grau de igualdade baseado em fun\u00e7\u00f5es difusas que de\ufb01ne a similaridade entre os pesos do termo nos dois vetores, e o valor encontrado \u00e9 acumulado. Esse valor total acumulado vai de\ufb01nir o grau de similaridade entre a not\u00edcia que est\u00e1 sendo analisada e o \u00edndice representativo da categoria.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">O resultado deste processo \u00e9 um valor entre zero e um, como todo resultado difuso. Quanto mais pr\u00f3ximos de zero, menos similares ser\u00e3o os documentos e quanto mais pr\u00f3ximos a um, mais similares.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Ap\u00f3s gerado o grau de similaridade entre a not\u00edcia e as categorias, no caso not\u00edcia falsa ou verdadeira, naquela categoria em que obtiver maior grau de similaridade, a not\u00edcia ser\u00e1 categorizada.\u00a0<\/span><\/p>\n<p><b>Conclus\u00f5es<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Identi\ufb01car a veracidade de uma not\u00edcia \u00e9 uma tarefa de alt\u00edssima complexidade devido ao fato de que uma not\u00edcia, em sua ess\u00eancia, traz alguma informa\u00e7\u00e3o nova e, portanto,\u00a0 nem sempre existe um padr\u00e3o para compara\u00e7\u00e3o e identi\ufb01ca\u00e7\u00e3o da autenticidade. Talvez a forma mais assertiva de garantir que a not\u00edcia \u00e9 real, seja con\ufb01rmando se a fonte da publica\u00e7\u00e3o da not\u00edcia \u00e9 con\ufb01\u00e1vel e se as partes envolvidas con\ufb01rmam o fato; devido ao grande n\u00famero de informa\u00e7\u00f5es que s\u00e3o divulgadas diariamente, essa \u00e9 uma ideia impratic\u00e1vel. Diante desta di\ufb01culdade, a comunidade cient\u00ed\ufb01ca vem buscando solu\u00e7\u00f5es em diferentes \u00e1reas de conhecimento no intuito de conter o avan\u00e7o das fake news, problema este, talvez n\u00e3o t\u00e3o novo, mas que vem se agravando recentemente. Desta forma entende-se que a pesquisa realizada contribui nessa busca apresentando a possibilidade da detec\u00e7\u00e3o autom\u00e1tica de fake news alcan\u00e7ando resultados signi\ufb01cativos, como podemos ver a seguir.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Durante a fase de categoriza\u00e7\u00e3o de novas not\u00edcias foram apresentadas ao prot\u00f3tipo as 720 not\u00edcias desconhecidas pelo mesmo, sendo 360 not\u00edcias de cada categoria. O prot\u00f3tipo conseguiu categorizar corretamente 331 not\u00edcias da categoria de falsas e 324 not\u00edcias da categoria de verdadeiras.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Analisando os dados apresentados acima conclui-se que o processo implementado alcan\u00e7ou o seu objetivo e se mostrou e\ufb01ciente. A combina\u00e7\u00e3o das t\u00e9cnicas utilizadas em cada fase do processo foi muito importante para que o objetivo \ufb01nal fosse alcan\u00e7ado.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">A t\u00e9cnica de similaridade difusa, utilizada na categoriza\u00e7\u00e3o, apresentou excelentes resultados. O processo simples, baseado em fun\u00e7\u00f5es de infer\u00eancia da l\u00f3gica difusa, permite de\ufb01nir o qu\u00e3o similar s\u00e3o dois \u00edndices e n\u00e3o apenas se eles s\u00e3o similares ou n\u00e3o.\u00a0<\/span><\/p>\n<p><strong>Refer\u00eancias\u00a0<\/strong><\/p>\n<p><span style=\"font-weight: 400;\">[1] H. Ahmed, I.Traore, and S. Saad. Detection of online fake news using n-gram analysis and machine learning techniques. In In: Traore I., Woungang I., Awad A. (eds) Intelligent, Secure, and Dependable Systems in Distributed and Cloud Environments. ISDDC 2017. Lecture Notes in Computer Science, volume 10618, 2017. 1\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">[2] D. Cersosimo. Global advisor: Fake news, \ufb01lter bubbles, post-truth and truth, 2018. 1\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">[3] J. Gottfried and E. Shearer. News use across social media platforms 2016, 2016. 1\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">[4] T. Mitchell. Machine Learning. McGraw-Hill, 1997. 2\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">[5] R. A. Monteiro, R. L. S. Santos, T. A. S. Pardo, T. A. de Almeida, E. E. S. Ruiz, and O. A. Vale. Contributions to the study of fake news in portuguese: New corpus and automatic detection results. In In: Proceedings of the 13th International Conference, PROPOR 2018, pages 324\u2013334, September 2018. 1, 2\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">[6] S. Vosoughi, D. Roy, and S. Aral. The spread of true and false news online. Science, 359:1146\u20131151, March 2018. 1\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">[7] L. K. Wives. Um estudo sobre agrupamento de documentos textuais em processamento de informa\u00e7\u00f5es n\u00e3o estruturadas usando t\u00e9cnicas de \u201cclustering\u201d. 1999<\/span><\/p>\n<p><span style=\"font-weight: 400;\">[8]<\/span> <a href=\"https:\/\/portalms.saude.gov.br\/fakenews\/\"><span style=\"font-weight: 400;\">https:\/\/portalms.saude.gov.br\/fakenews\/<\/span><\/a><\/p>\n<p><span style=\"font-weight: 400;\">[9] https:\/\/www.bbc.com\/portuguese\/brasil-46146756\u00a0<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>As not\u00edcias falsas, do ingl\u00eas fake news, como s\u00e3o amplamente [&hellip;]<\/p>\n","protected":false},"author":33,"featured_media":50679,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[117,152],"tags":[],"coauthors":[207],"class_list":["post-52810","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-machine-learning-en","category-machine-learning-en-2"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v26.7 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning - Natural Language Processing (NLP) - Instituto Eldorado<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/\" \/>\n<meta property=\"og:locale\" content=\"en_US\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning - Natural Language Processing (NLP) - Instituto Eldorado\" \/>\n<meta property=\"og:description\" content=\"As not\u00edcias falsas, do ingl\u00eas fake news, como s\u00e3o amplamente [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/\" \/>\n<meta property=\"og:site_name\" content=\"Instituto Eldorado\" \/>\n<meta property=\"article:published_time\" content=\"2021-09-30T14:06:41+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-03-03T19:22:41+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1000\" \/>\n\t<meta property=\"og:image:height\" content=\"563\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Thais Silva Galho\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Thais Silva Galho\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"10 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/\"},\"author\":{\"name\":\"Thais Silva Galho\",\"@id\":\"https:\/\/www.eldorado.org.br\/#\/schema\/person\/5e3a0c0b03b4caec332a045081ee0963\"},\"headline\":\"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning &#8211; Natural Language Processing (NLP)\",\"datePublished\":\"2021-09-30T14:06:41+00:00\",\"dateModified\":\"2022-03-03T19:22:41+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/\"},\"wordCount\":2497,\"commentCount\":0,\"image\":{\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg\",\"articleSection\":[\"Machine Learning\",\"Machine Learning\"],\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/\",\"url\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/\",\"name\":\"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning - Natural Language Processing (NLP) - Instituto Eldorado\",\"isPartOf\":{\"@id\":\"https:\/\/www.eldorado.org.br\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg\",\"datePublished\":\"2021-09-30T14:06:41+00:00\",\"dateModified\":\"2022-03-03T19:22:41+00:00\",\"author\":{\"@id\":\"https:\/\/www.eldorado.org.br\/#\/schema\/person\/5e3a0c0b03b4caec332a045081ee0963\"},\"breadcrumb\":{\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#breadcrumb\"},\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#primaryimage\",\"url\":\"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg\",\"contentUrl\":\"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg\",\"width\":1000,\"height\":563},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/www.eldorado.org.br\/en\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning &#8211; Natural Language Processing (NLP)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.eldorado.org.br\/#website\",\"url\":\"https:\/\/www.eldorado.org.br\/\",\"name\":\"Instituto Eldorado\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.eldorado.org.br\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"en-US\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.eldorado.org.br\/#\/schema\/person\/5e3a0c0b03b4caec332a045081ee0963\",\"name\":\"Thais Silva Galho\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/www.eldorado.org.br\/#\/schema\/person\/image\/4e7aef2b40cb62e2b5f6783d79f327e7\",\"url\":\"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/attachment_KxH2wF2y-150x150.jpg\",\"contentUrl\":\"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/attachment_KxH2wF2y-150x150.jpg\",\"caption\":\"Thais Silva Galho\"},\"description\":\"Analista de Desenvolvimento de Software S\u00eanior\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning - Natural Language Processing (NLP) - Instituto Eldorado","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/","og_locale":"en_US","og_type":"article","og_title":"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning - Natural Language Processing (NLP) - Instituto Eldorado","og_description":"As not\u00edcias falsas, do ingl\u00eas fake news, como s\u00e3o amplamente [&hellip;]","og_url":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/","og_site_name":"Instituto Eldorado","article_published_time":"2021-09-30T14:06:41+00:00","article_modified_time":"2022-03-03T19:22:41+00:00","og_image":[{"width":1000,"height":563,"url":"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg","type":"image\/jpeg"}],"author":"Thais Silva Galho","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Thais Silva Galho","Est. reading time":"10 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#article","isPartOf":{"@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/"},"author":{"name":"Thais Silva Galho","@id":"https:\/\/www.eldorado.org.br\/#\/schema\/person\/5e3a0c0b03b4caec332a045081ee0963"},"headline":"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning &#8211; Natural Language Processing (NLP)","datePublished":"2021-09-30T14:06:41+00:00","dateModified":"2022-03-03T19:22:41+00:00","mainEntityOfPage":{"@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/"},"wordCount":2497,"commentCount":0,"image":{"@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#primaryimage"},"thumbnailUrl":"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg","articleSection":["Machine Learning","Machine Learning"],"inLanguage":"en-US","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/","url":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/","name":"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning - Natural Language Processing (NLP) - Instituto Eldorado","isPartOf":{"@id":"https:\/\/www.eldorado.org.br\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#primaryimage"},"image":{"@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#primaryimage"},"thumbnailUrl":"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg","datePublished":"2021-09-30T14:06:41+00:00","dateModified":"2022-03-03T19:22:41+00:00","author":{"@id":"https:\/\/www.eldorado.org.br\/#\/schema\/person\/5e3a0c0b03b4caec332a045081ee0963"},"breadcrumb":{"@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#breadcrumb"},"inLanguage":"en-US","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/"]}]},{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#primaryimage","url":"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg","contentUrl":"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/shutterstock_1071241622-2.jpg","width":1000,"height":563},{"@type":"BreadcrumbList","@id":"https:\/\/www.eldorado.org.br\/en\/blog\/entenda-a-deteccao-automatica-de-fake-news-por-similaridade-difusa-com-machine-learning-natural-language-processing-nlp\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.eldorado.org.br\/en\/"},{"@type":"ListItem","position":2,"name":"Entenda a Detec\u00e7\u00e3o Autom\u00e1tica de Fake News por Similaridade Difusa com Machine Learning &#8211; Natural Language Processing (NLP)"}]},{"@type":"WebSite","@id":"https:\/\/www.eldorado.org.br\/#website","url":"https:\/\/www.eldorado.org.br\/","name":"Instituto Eldorado","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.eldorado.org.br\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-US"},{"@type":"Person","@id":"https:\/\/www.eldorado.org.br\/#\/schema\/person\/5e3a0c0b03b4caec332a045081ee0963","name":"Thais Silva Galho","image":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/www.eldorado.org.br\/#\/schema\/person\/image\/4e7aef2b40cb62e2b5f6783d79f327e7","url":"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/attachment_KxH2wF2y-150x150.jpg","contentUrl":"https:\/\/www.eldorado.org.br\/wp-content\/uploads\/2021\/09\/attachment_KxH2wF2y-150x150.jpg","caption":"Thais Silva Galho"},"description":"Analista de Desenvolvimento de Software S\u00eanior"}]}},"_links":{"self":[{"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/posts\/52810","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/users\/33"}],"replies":[{"embeddable":true,"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/comments?post=52810"}],"version-history":[{"count":0,"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/posts\/52810\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/media\/50679"}],"wp:attachment":[{"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/media?parent=52810"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/categories?post=52810"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/tags?post=52810"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.eldorado.org.br\/en\/wp-json\/wp\/v2\/coauthors?post=52810"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}