
Pourquoi les plus grands développeurs d'intelligence artificielle de la Silicon Valley recrutent-ils des romanciers et écrivains ? Pour nourrir leurs modèles d'intelligence artificielle.
De grandes entreprises de collecte de données destinée à entraîner les IA comme Scale AI et Appen, recrutent des poètes, romanciers, dramaturges et écrivains titulaires d'un doctorat ou d'une maîtrise, indique Rest of world. Des recrutements qui ne se limitent pas à l'anglais, puisque des postes en langue hindi ou japonaise sont également à pourvoir. Leur mission : écrire des nouvelles originales pour alimenter les modèles d'intelligence artificielle, dans le cadre d'une initiative visant à améliorer la qualité littéraire des outils d'écriture générative.
Plagier n'est pas créer
Les intelligences artificielles dites génératives sont capables de créer des textes en quelques secondes. Mais quid de la créativité ? « Ils ne sont pas conçus pour être géniaux, mais pour être aussi proches que possible de ce qui existe », indique Fabricio Goes, professeur d’informatique à l’Université de Leicester. Pour améliorer la qualité de production de ces outils, des entreprises comme Scale AI et Appen ont décidé de faire appel à des écrivains de fiction, de théâtre et de poésie, ainsi qu'à des experts en sciences humaines pour nourrir leurs modèles d'intelligence artificielle. Et elles sont prêtes à mettre le prix. Scale AI offre 13,98 dollars de l'heure pour un travailleur de données standard en japonais, et jusqu'à 50 dollars de l'heure pour un « poète, un éditeur de livres ou un rédacteur créatif expert ». Une rémunération qui s'explique en partie par le niveau de diplômes et de maîtrise de la langue exigés pour candidater. « Aujourd'hui, il ne suffit plus que quelqu'un parle la langue. Il ne suffit pas que quelqu'un soit natif. Ils doivent avoir un vocabulaire très large et maîtriser parfaitement la langue », explique Milagros Miceli, chercheuse au Distributed AI Research Institute.
Le cercle des poètes disparus
Selon les experts, ces entreprises qui comptent parmi leurs clients OpenAI, Meta, Google ou encore Microsoft, cherchent à se différencier de leurs concurrents en proposant des modèles plus « créatifs » . Le recrutement d'écrivains ou de poètes spécialisés en hindi, japonais, haoussa, pendjabi, thaï, lituanien où encore persan viserait à combler une carence de langage des modèles actuels. Si les outils d'IA générative comme ChatGPT prospèrent en anglais et en espagnol, les premières recherches montrent que ces outils sont sous-performants dans les langues « à faibles ressources », moins représentées sur Internet. « C'est une opportunité pour ces entreprises de s'imposer sur ces marchés avant que de nouveaux acteurs arrivent », souligne Dan Brown, professeur à l'Université de Waterloo.
Les experts avancent une autre motivation. Ces recrutements pourraient permettre de s'adapter aux problématiques de propriété intellectuelle et de droits d'auteur que soulèvent l'usage d'IA génératives comme ChatGPT ou Midjourney. En effet, de nombreux acteurs des industries créatives – illustrateurs de mangas au Japon, artistes musicaux en Inde, scénaristes de télévision aux États-Unis – ont récemment protesté contre l'approche des développeurs d'IA à l'égard du droit d'auteur. Plusieurs recours collectifs ont été déposés contre OpenAI par d'éminents auteurs et dramaturges, dont Michael Chabon, lauréat du prix Pulitzer. Ils affirment que leur travail, protégé par le droit d'auteur, a été inclus dans les données de formation de ChatGPT sans leur autorisation. Selon Julian Posada, professeur adjoint à l'Université de Yale, si cette vague de litiges en matière de droit d'auteur aboutit : « Nous pourrions arriver au point où il est impossible d'intégrer du matériel protégé par le droit d'auteur dans de nombreux modèles. » Nourrir les modèles d'IA à partir de créations originales pourrait ainsi leur permettre de détenir les droits sur les « créations de leurs outils ».
Participer à la conversation