L'apprentissage automatique peut aider à prédire la psychose via l'analyse du langage

Une nouvelle méthode d'apprentissage automatique peut prédire avec une précision de 93% si une personne à risque de psychose développera le trouble.

La méthode, développée par des scientifiques de l'Université Emory et de l'Université Harvard, a découvert qu'une utilisation plus élevée que la normale de mots liés au son, combinée à un taux plus élevé d'utilisation de mots ayant une signification similaire, signifiait que la psychose était probablement à l'horizon.

Même les cliniciens formés n'avaient pas remarqué comment les personnes à risque de psychose utilisent plus de mots associés au son que la moyenne, bien qu'une perception auditive anormale soit un signe d'alerte précoce.

«Essayer d'entendre ces subtilités dans les conversations avec les gens, c'est comme essayer de voir des germes microscopiques avec vos yeux», déclare Neguine Rezaii, première auteur de l'article. «La technique automatisée que nous avons développée est un outil très sensible pour détecter ces modèles cachés. C'est comme un microscope pour détecter les signes avant-coureurs de la psychose. "

L'apparition de la schizophrénie et d'autres troubles psychotiques survient généralement au début de la vingtaine, avec des signes précoces - connus sous le nom de syndrome prodromique - commençant vers l'âge de 17 ans. Environ 25 à 30 pour cent des jeunes atteints du syndrome prodromique développeront éventuellement une schizophrénie ou un autre trouble psychotique.

Actuellement, il n'existe aucun remède contre la psychose. Grâce à des entretiens structurés et des tests cognitifs, les cliniciens formés peuvent prédire la psychose avec une précision d'environ 80% chez les personnes atteintes d'un syndrome prodromique.

Désormais, la recherche avec l'apprentissage automatique, une forme d'intelligence artificielle capable de découvrir des modèles cachés, est l'un des nombreux efforts en cours pour rationaliser les méthodes de diagnostic, identifier de nouvelles variables et améliorer la précision des prédictions.

«On savait auparavant que des caractéristiques subtiles de la future psychose sont présentes dans le langage des gens, mais nous avons utilisé l'apprentissage automatique pour découvrir des détails cachés sur ces caractéristiques», explique l'auteur principal Phillip Wolff, professeur de psychologie à Emory. Le laboratoire de Wolff se concentre sur la sémantique du langage et l'apprentissage automatique pour prédire la prise de décision et la santé mentale.

Pour l'étude, les chercheurs ont d'abord utilisé l'apprentissage automatique pour établir des «normes» pour le langage conversationnel. Ils ont alimenté un logiciel informatique les conversations en ligne de 30 000 utilisateurs de Reddit, une plate-forme de médias sociaux où les gens ont des discussions informelles sur une gamme de sujets.

Le logiciel, connu sous le nom de Word2Vec, utilise un algorithme pour changer des mots individuels en vecteurs (un terme mathématique faisant référence à la position d'un point dans l'espace par rapport à un autre). En d'autres termes, le programme attribuait chaque mot à un emplacement dans un espace sémantique en fonction de sa signification. Les mots ayant des significations similaires étaient placés plus près les uns des autres que ceux ayant des significations très différentes.

Le laboratoire Wolff a également développé un programme informatique pour effectuer un «déballage vectoriel» ou une analyse de la densité sémantique de l'utilisation des mots. Le déballage vectoriel a permis aux chercheurs de quantifier la quantité d'informations contenues dans chaque phrase.

Après avoir généré une base de données «normales», les chercheurs ont appliqué les mêmes techniques aux entretiens diagnostiques de 40 jeunes à haut risque de psychose. Les analyses automatisées des échantillons des participants ont ensuite été comparées à l'échantillon de base normal.

Les résultats ont montré qu'une utilisation plus élevée que la normale de mots liés au son, associée à un taux plus élevé d'utilisation de mots ayant une signification similaire, signifiait que la psychose était susceptible de se produire.

Les points forts de l'étude comprennent la simplicité de n'utiliser que deux variables - qui ont toutes deux une base théorique solide - la réplication des résultats dans un ensemble de données récalcitrant et la grande précision de ses prévisions, à plus de 90%.

«Dans le domaine clinique, nous manquons souvent de précision», dit Rezaii. «Nous avons besoin de moyens plus quantifiés et objectifs pour mesurer des variables subtiles, telles que celles cachées dans l'usage de la langue.»

Rezaii et Wolff rassemblent maintenant des ensembles de données plus volumineux et testent l'application de leurs méthodes sur diverses maladies neuropsychiatriques, y compris la démence.

«Cette recherche est intéressante non seulement pour son potentiel à révéler davantage la maladie mentale, mais aussi pour comprendre comment fonctionne l'esprit - comment il rassemble les idées», dit Wolff. «La technologie d'apprentissage automatique progresse si rapidement qu'elle nous donne des outils pour exploiter les données dans l'esprit humain.»

La co-auteure Elaine Walker, professeure Emory de psychologie et de neurosciences, déclare: «Si nous pouvons identifier les personnes à risque plus tôt et utiliser des interventions préventives, nous pourrons peut-être remédier aux déficits.»

Les résultats sont publiés dans la revue npj schizophrénie.

Source: Emory Health Sciences

!-- GDPR -->