Comment déterminer quels tweets sont crédibles

Des chercheurs du Georgia Institute of Technology ont développé un nouveau modèle de langage montrant quels mots et expressions influencent positivement ou négativement la crédibilité des événements mondiaux rapportés sur Twitter.

L'étude, qui a numérisé 66 millions de tweets concernant près de 1 400 événements du monde réel, suggère que les paroles de millions de personnes sur les réseaux sociaux peuvent offrir des informations considérables sur la crédibilité d'un événement, même lorsqu'un événement est encore en cours.

«Il y a eu de nombreuses études sur la crédibilité des médias sociaux ces dernières années, mais on en sait très peu sur les types de mots ou d'expressions qui créent des perceptions de crédibilité lors d'événements qui se déroulent rapidement», a déclaré Tanushree Mitra, titulaire d'un doctorat de Georgia Tech. candidat qui a dirigé la recherche.

L'équipe a étudié les tweets concernant les événements mondiaux de 2014 et 2015, notamment l'émergence d'Ebola en Afrique de l'Ouest, l'attaque de Charlie Hebdo à Paris et la mort d'Eric Garner à New York.

Les chercheurs ont demandé aux gens de juger les publications sur leur crédibilité (de «certainement exact» à «certainement inexact»). Ensuite, l'équipe a introduit les mots dans un modèle qui les a divisés en 15 catégories linguistiques différentes. Les classifications comprenaient les émotions positives et négatives, les haies et les boosters, et l'anxiété.

L'ordinateur de Georgia Tech a ensuite examiné les mots pour juger si les tweets étaient crédibles ou non. Il correspondait aux opinions des humains environ 68% du temps, un pourcentage nettement supérieur à la base aléatoire de 25%.

«Les tweets contenant des mots stimulants, tels que« indéniable », et des termes d’émotion positive, tels que« désireux »et« formidable », étaient considérés comme hautement crédibles», a déclaré Mitra. «Les mots indiquant un sentiment positif mais se moquant de l’impraticabilité de l’événement, tels que« ha »,« sourires »ou« plaisanterie », étaient considérés comme moins crédibles. Il en était de même pour les mots de couverture, y compris «certain niveau» et «suspects». »

Un nombre plus élevé de retweets était associé à des scores de crédibilité plus faibles.Les réponses et les retweets avec des messages plus longs étaient jugés plus crédibles.

"Il se peut que des messages plus longs fournissent plus d'informations ou de raisonnement, ils sont donc considérés comme plus fiables", a-t-elle déclaré. «D'un autre côté, un nombre plus élevé de retweets, dont la crédibilité a été inférieure, pourrait représenter une tentative de susciter un raisonnement collectif en période de crise ou d'incertitude.»

Bien que le modèle ne soit pas encore déployable, les chercheurs affirment qu'ils pourraient éventuellement développer une application capable de calculer la fiabilité perçue d'un événement au fur et à mesure qu'il se déroule sur les réseaux sociaux.

«Lorsqu'il est combiné avec d'autres signaux, tels que des sujets d'événements ou des informations structurelles, notre résultat linguistique pourrait être un élément important d'un système automatisé», a déclaré le Dr Eric Gilbert, conseiller de Mitra et professeur assistant à la Georgia Tech's School of Interactive Computing.

«Twitter fait partie du problème de la diffusion d'informations mensongères en ligne. Mais cela peut aussi faire partie de la solution. »

Source: Institut de technologie de Géorgie

!-- GDPR -->