un idiot devant un test

Les neuroscientifiques du MIT sont catégoriques : utiliser ChatGPT rend con

Efficace à court terme, l’usage des grands modèles de langage dans le cadre d’un travail d’écriture aurait tendance à entraver le développement de compétences cognitives fondamentales.

« ChatGPT, aide-moi à rédiger cette rédaction donnée par mon prof, et surtout fais en sorte que ton style d’écriture soit indétectable. » Ce petit prompt a sans doute été tapé de très nombreuses fois par des lycéens et étudiants depuis la sortie des grands modèles de langage fin 2022. Alors que l’usage de ChatGPT touche 93 % des jeunes (dont 42 % en feraient un usage quotidien selon l’étude BornAi de Heaven), cette habitude pourrait avoir des conséquences néfastes sur le cerveau à moyen terme.

Ça, c'est ton cerveau sous ChatGPT

Une nouvelle étude intitulée « Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task » (Votre cerveau sur ChatGPT : accumulation de dette cognitive lors de l'utilisation d'un assistant IA pour une tâche de rédaction d’essai), publiée par des chercheurs du MIT Media Lab, montre pour la première fois que l’usage des assistants IA ne nous rend pas vraiment plus intelligents.

L’expérience a suivi pendant quatre mois 54 étudiants et jeunes professionnels, répartis en trois groupes distincts. Le premier utilisait ChatGPT pour rédiger des rédactions, le second, un moteur de recherche classique comme Google, et le troisième, baptisé le « groupe Cerveau-Seul », devait se fier à leurs connaissances seules. L'activité cérébrale des participants ainsi que leurs essais ont été analysés avant d'être évalués par des enseignants humains et même par une IA juge.

« Délestage cognitif »

Les résultats confirment ce qu’on pouvait imaginer avec un peu de pratique et d’intuition. Le groupe n’utilisant pas d’aide numérique a montré la connectivité neurale la plus forte et la plus étendue, suggérant un engagement cognitif interne élevé, une recherche sémantique créative et un contrôle exécutif accru. Ceux qui utilisent un moteur de recherche ont présenté un engagement intermédiaire, avec une connectivité totale inférieure de 34 à 48 % par rapport au groupe Cerveau-Seul. Les régions du cerveau basées sur l'information visuelle et l'intégration visuo-exécutive étaient particulièrement sollicitées.

Enfin, le groupe utilisant des LLM a présenté la connectivité la plus faible (jusqu'à 55 % de réduction par rapport au groupe Cerveau-Seul). Leurs cerveaux semblaient soulagés d'une partie du travail de planification et de génération d'idées, assurée en partie par l’IA. C’est ce que les chercheurs appellent le « délestage cognitif ».

Du côté des essais, les résultats ne sont guère brillants pour le groupe des LLM. Ces derniers ont eu plus de mal à citer leur propre travail, preuve qu’ils n’ont pas vraiment intégré les connaissances dans leur mémoire. S’ajoute à cela un sentiment d’appropriation du travail « fragmenté » : certains sujets ont déclaré qu’ils ne se sentaient pas pleinement auteurs de leur texte, qualifiant leur travail de « partiellement le leur ».

Des effets sur le long terme ?

Les chercheurs s’inquiètent aussi des effets potentiels à moyen terme des LLM. Lors d’une nouvelle session de rédaction, le groupe habitué à l’usage de l’IA a dû écrire un essai sans avoir accès aux assistants. Leurs cerveaux n'ont alors pas retrouvé le niveau d'engagement observé chez les « Cerveaux-Seuls » entraînés sans IA. Cela suggère que la dépendance à l'IA pourrait freiner le développement de réseaux neuronaux essentiels à la planification, au langage et au contrôle attentionnel. En d'autres termes, l'IA pourrait nous rendre moins performants lorsque nous sommes livrés à nous-mêmes, installant une véritable « dette cognitive » rendant le raisonnement et la génération d’idées plus difficiles.

Cette première étude doit évidemment être prise avec des pincettes, notamment à cause du faible échantillon, de l’homogénéité des sujets testés ainsi que de sa méthodologie. Les chercheurs appellent à mener d’autres études incluant des professionnels, diverses tranches d'âge, et une meilleure mixité de genre afin de garantir des résultats plus précis. L'absence de subdivision de la tâche de rédaction en sous-tâches distinctes (génération d'idées, écriture, etc.), contrairement à des études antérieures, est une autre limite à prendre en compte. D’ici là, pensez-y à deux fois avant d’ouvrir l’application de ChatGPT à la moindre question…

David-Julien Rahmil

David-Julien Rahmil

Squatteur de la rubrique Médias Mutants et Monde Créatif, j'explore les tréfonds du web et vous explique comment Internet nous rend toujours plus zinzin. Promis, demain, j'arrête Twitter.

Discutez en temps réel, anonymement et en privé, avec une autre personne inspirée par cet article.

Viens on en parle !
Podacast : En immersion
commentaires

Participer à la conversation

Laisser un commentaire