Les tweets fournissent de nombreuses données de santé publique

La croissance phénoménale des médias sociaux a créé un véhicule de communication sans précédent. À lui seul, Twitter permet à des millions de fans de médias sociaux de commenter en 140 caractères ou moins à peu près n'importe quoi.

Un nouvel effort de recherche a cherché à savoir si ce format numérique pouvait être utilisé pour suivre les tendances importantes de la santé publique. Et, selon deux informaticiens de l'Université Johns Hopkins, le tweet en un seul mot est: «Oui!»

Drs. Mark Dredze et Michael J. Paul ont alimenté 2 milliards de tweets publics publiés entre mai 2009 et octobre 2010 sur des ordinateurs, puis ont utilisé un logiciel pour filtrer les 1,5 million de messages qui faisaient référence à des questions de santé. Les identités des tweeters n'ont pas été collectées.

«Notre objectif était de savoir si les publications sur Twitter pouvaient être une source utile d'informations sur la santé publique», a déclaré Dredze.

«Nous avons déterminé qu'en effet, ils le pouvaient. Dans certains cas, nous avons probablement appris des choses dont même les médecins des tweeters n'étaient pas au courant, comme les médicaments en vente libre que les affiches utilisaient pour traiter leurs symptômes à la maison. "

En triant ces tweets liés à la santé en «piles» électroniques, Dredze et Paul ont découvert des schémas intrigants sur les allergies, les cas de grippe, l'insomnie, le cancer, l'obésité, la dépression, la douleur et d'autres maux.

«Il y a eu quelques études étroites utilisant des publications sur Twitter, par exemple, pour suivre la grippe», a déclaré Dredze. "Mais à notre connaissance, personne n'a jamais utilisé les tweets pour examiner autant de problèmes de santé que nous."

Dredze et Paul présenteront leur étude complète le 18 juillet à Barcelone, en Espagne, lors de la Conférence internationale sur les blogs et les médias sociaux, parrainée par l'Association pour l'avancement de l'intelligence artificielle.

En plus de trouver une gamme de problèmes de santé dans les publications sur Twitter, les chercheurs ont pu enregistrer de nombreux médicaments consommés par des tweeters malades, grâce à des messages tels que: «Il fallait faire apparaître un Benadryl… les allergies sont les pires.»

D'autres tweets ont souligné une mauvaise utilisation des médicaments.

"Nous avons constaté que certaines personnes ont tweeté qu'elles prenaient des antibiotiques pour la grippe", a déclaré Paul. «Mais les antibiotiques ne fonctionnent pas sur la grippe, qui est un virus, et cette pratique pourrait contribuer aux problèmes croissants de résistance aux antibiotiques. Donc, ces tweets nous ont montré qu'il existe de sérieuses idées fausses médicales. »

Bien sûr, la grande majorité des tweets quotidiens n'ont rien à voir avec une maladie. Alors qu'une approche simple consisterait à filtrer les mots liés à la maladie, tels que «mal de tête» ou «fièvre», cette stratégie échoue sur des tweets tels que «Le prix élevé de l'essence est un casse-tête pour mon entreprise» ou «J'ai un cas de Bieber Fever. J'adore sa nouvelle chanson.

Pour trouver les messages liés à la santé parmi les milliards de messages de leur pool d'origine, les chercheurs de Johns Hopkins ont appliqué un système de filtrage et de catégorisation qu'ils ont conçu. Avec cet outil, les ordinateurs peuvent apprendre à ne pas tenir compte des phrases qui n’ont pas vraiment de rapport avec la santé, même si elles contiennent un mot couramment utilisé dans un contexte de santé.

Une fois les tweets non liés supprimés, les résultats restants ont fourni des résultats surprenants.

"Quand nous avons commencé, je ne savais même pas si les gens parlaient d'allergies sur Twitter", a déclaré Paul. «Mais nous avons découvert qu'ils le font. Et il y avait une chose à laquelle je ne m'attendais pas: le système a détecté deux types d'allergies différents: le type qui provoque des reniflements et des éternuements et celui qui provoque des éruptions cutanées et de l'urticaire. "

Dans environ 200 000 tweets liés à la santé, les chercheurs ont pu s'appuyer sur des informations publiques fournies par les utilisateurs pour identifier l'État à partir duquel le message a été envoyé. Cela leur a permis de suivre certaines tendances par temps et par lieu, par exemple lorsque la saison des allergies et de la grippe a atteint son apogée dans diverses régions du pays.

"Nous avons pu voir dans les tweets que la saison des allergies a commencé plus tôt dans les États plus chauds et plus tard dans le Midwest et le Nord-Est", a déclaré Dredze.

Dredze et Paul ont déjà commencé à parler à des scientifiques de la santé publique, y compris certains affiliés à Johns Hopkins, qui disent que les futures études sur les tweets pourraient révéler des données encore plus utiles, non seulement sur les problèmes médicaux des affiches, mais aussi sur les perceptions du public concernant les maladies, les médicaments et autres problèmes de santé.

Pourtant, Dredze et Paul ont averti qu'essayer de prendre la température du pays en analysant les tweets a ses limites.

D'une part, la plupart des utilisateurs de Twitter n'ont pas commenté plus d'une fois leur maladie particulière, ce qui rend difficile le suivi de la durée de la maladie et de sa récurrence. En outre, la plupart des utilisateurs de Twitter ont tendance à être jeunes, ce qui exclurait de nombreux seniors d'une étude de santé publique. De plus, pour le moment, Twitter est dominé par des utilisateurs résidant aux États-Unis, ce qui le rend moins utile pour la recherche dans d'autres pays.

Bien que les sites de médias sociaux permettent aux utilisateurs d'exposer de nombreuses informations personnelles à des amis et à des inconnus, la recherche basée sur Twitter ne peut atteindre qu'une certaine profondeur.

«Dans notre étude», a déclaré Paul, «nous ne pouvions apprendre que ce que les gens étaient prêts à partager. Nous pensons qu'il y a une limite à ce que les gens sont prêts à partager sur Twitter. "

Néanmoins, Dredze dit qu'il reste encore beaucoup de données utiles à extraire des publications Twitter. "Les personnes à qui j'ai parlé ont estimé qu'il s'agissait d'un outil de recherche vraiment intéressant", a-t-il déclaré, "et ils ont d'excellentes idées sur ce qu'ils aimeraient apprendre ensuite sur Twitter."

Source: Université Johns Hopkins

!-- GDPR -->