baby

Une IA apprend ses premiers mots grâce à un bébé

Un bébé équipé d'une caméra frontale enseigne à une IA les mécanismes d'apprentissage du langage. « L’objectif est de rapprocher l’IA de l’intelligence humaine. »

Une étude publiée dans la revue Science décrit comment l'équipe de Brenden Lake, professeur agrégé de psychologie et de science des données à l'Université de New York, a utilisé les enregistrements d'un bébé australien (Sam), pour entraîner une IA à comprendre le langage humain. « Nous avons montré pour la première fois qu'il était possible de former un modèle d'IA pour qu'il apprenne des mots à travers les yeux et les oreilles d'un seul enfant », se réjouit Brenden Lake. De 6 à 32 mois, pendant 61 heures (soit 1 % de ses heures d'éveil) une caméra de type GoPro a capturé des extraits de la vie de Sam. Mais ce qui à première vue ressemble à une jolie vidéo de famille est en réalité une expérience scientifique visant à comprendre si une IA peut apprendre le langage comme un enfant. Au-delà, les résultats pourraient révéler comment les enfants acquièrent le langage dès leur plus jeune âge.

Sam équipé d'une caméra frontale

Un jeu d'enfant

Pour former le modèle – baptisé Child's View for Contrastive Learning (CVCL) – l'équipe de chercheurs a utilisé 600 000 images associées aux 37 500 « énoncés » prononcés par Sam et son entourage. Une approche différente de celle adoptée par les grands modèles de langage comme ChatGPT ou Bard formés à partir de milliards (voire de billions) de corpus de textes, alors que les enfants (qui n’ont accès qu’à une infime partie de ces données) comprennent dès l’âge de deux ans jusqu'à 300 mots. À quatre ans, le vocabulaire moyen atteint plus de 1 000 mots.

Au cours des tests, le modèle a réussi à associer de nombreux mots aux images correspondantes. Dans une évaluation la précision était d’environ 62 % (bien mieux que la précision de 25 % des suppositions aléatoires de l’IA). De plus, lors de tests sur de nouvelles images (ne provenant pas du référentiel d'enregistrement de Sam) l'IA a démontré sa capacité à généraliser ce qu'elle avait appris. Selon, Linda Smith, professeur de psychologie et de sciences du cerveau à l'université d'Indiana à Bloomington, ces nouveaux travaux constituent « une véritable contribution » à la science.

Rapprocher l’IA de l’intelligence humaine

En passant de simple « moteur statistique fastidieux pour la correspondance de modèles » (selon l'expression du linguiste Noam Chomsky), ces nouveaux modèles d’IA pourraient être capables d'imiter l'apprentissage des humains. C'est le point de vue d'Howard Shrobe, responsable d'un programme à la Defense Advanced Research Projects Agency, qui a financé une partie du projet. « Les systèmes d'IA sont encore fragiles et manquent de bon sens. Mais une IA capable d’apprendre comme un enfant pourrait être capable de comprendre le sens, de réagir à de nouvelles situations et d’apprendre de nouvelles expériences. L’objectif est de rapprocher l’IA de l’intelligence humaine. » C'est précisément l'objectif de la prochaine étape du projet. « Avec le bon type de données, l’écart entre l’apprentissage automatique et l’apprentissage humain pourrait se réduire considérablement. », indique Wai Keen Vong, chercheur en informatique cognitive à l'Université de New York.

Comprendre l'apprentissage du langage chez les humains

L'étude s’étant uniquement concentrée sur la reconnaissance des noms d’objets physiques, les scientifiques reconnaissent que leurs découvertes ne prouvent pas comment les enfants acquièrent les mots. « Le langage implique également des verbes, des structures et des concepts abstraits que les enfants commencent à comprendre très tôt à partir de leur propre expérience. Cette recherche n’a pas démontré que l’IA peut faire la même chose avec les données limitées sur lesquelles le modèle d’étude a été formé », souligne Eva Portelance, chercheuse en linguistique à l’Institut d’intelligence artificielle Mila-Québec.

Toutefois, la chercheuse en linguistique se réjouit de cette nouvelle étape vers une compréhension plus profonde de notre propre cerveau. Elle voit dans ces recherches une possibilité de trouver des réponses sur la manière dont les enfants acquièrent le langage. À ce jour deux hypothèses, difficiles à valider via les tests cognitifs traditionnels, s'opposent : apprendraient-ils simplement à faire correspondre ce qu'ils voient à ce qu'ils entendent ou l’apprentissage des langues nécessiterait-il une expérience plus large du monde (interaction sociale, capacité de raisonner…) ? Au-delà, selon Portelance la recherche sur l'IA ne doit pas nécessairement se limiter à maximiser les capacités des robots et les profits des entreprises. Elle doit également permettre d'avancer sur le fonctionnement humain : « Nous pouvons utiliser ces modèles à bon escient : au profit de la science et de la société ».

Peggy Baron

Chaque jour je m'installe à la terrasse de l'actu et je regarde le monde en effervescence. J'écris aussi bien sur les cafards cyborg que sur le monde du travail, sans oublier l'environnement et les tendances conso.

Discutez en temps réel, anonymement et en privé, avec une autre personne inspirée par cet article.

Viens on en parle !
Podacast : En immersion
commentaires

Participer à la conversation

Laisser un commentaire