Regard de femme derrière un clap de film

Il écrit son prochain scénario avec une I.A. Et le résultat le fascine

© Mason Kimbarovski

Le scénariste Simon Bouisson écrit son prochain film avec une intelligence artificielle. Une collaboration qui ne cesse pas de le surprendre. Nous aussi. Il nous raconte.

Simon Bouisson est l’un des auteurs-réalisateurs français les plus passionnants. Toute son œuvre interroge notre rapport à la technologie et les divers fantasmes qu’elle provoque. Aujourd’hui, il a conscience que ses progrès pourraient impacter son métier. À tel point qu’il en a fait son sujet d’exploration et a décidé d’écrire son prochain film avec un algorithme. En résidence en Californie, dans le cadre de la Villa Albertine, où le cinéma (Los Angeles) et les nouvelles technologies (San Francisco) dialoguent et s’inspirent sans cesse, Simon est parti à la rencontre des ingénieurs, chercheurs, producteurs qui défrichent le terrain de l’intelligence artificielle. 

Qu’est-ce qu’un algorithme peut apporter à l’écriture d’un scénario ? 

Simon Bouisson : Un algorithme génère des récits très étranges ; des textes qu’il a lus, des mouvements de personnages qu’il a vu passer, il les recrache en les mélangeant librement. Tout ce que les détracteurs vont trouver contre la machine, c’est précisément ce qui m’intéresse, en tant qu’auteur. Par exemple, on n’est pas sûr qu’elle donne des faits avérés, parfois elle va partir dans de la fiction, mélanger des problématiques sans s’en rendre compte et créer des récits faux. Elle fait un peu le travail d’auteur, au moment de l’écriture : on cherche des parcours de personnages, des péripéties ; on va mélanger des éléments, des images qu’on a, pour créer de nouvelles idées. 

Quels ont été vos premiers échanges avec l’IA ? Avec qui avez-vous travaillé ?  

S. B. : J’ai demandé aux organisateurs de la Villa de me mettre en lien avec les ingénieurs. L’équipe d’OpenAI m’a mis un GPT-3 entre les mains. J’ai été connecté à ce qui s’appelle le « terrain de jeu » (playground) d’OpenAI. Quand on écrit, on règle le débit de la machine. On commence sa phrase, et la machine nous propose la suite, etc. Finalement, je garde peut-être 30 % de ce qu’elle me propose, et je réécris, mais en lisant ses suggestions je me dis : « tiens, c’est intéressant, elle me propose d’aller à un endroit auquel je n’aurais pas pensé. » C’est ce qui m’amuse, comme une dérive situationniste, la machine va à chaque fois emmener vers quelque chose de complètement inattendu. En fait, c’est ce que je fais quand je travaille avec mes coscénaristes. Comme je ne suis pas le cerveau de l’autre, il y en a toujours un qui arrive à une trajectoire, une suggestion, qui nous surprend.

Au fond, c’est l’auteur qui écrit, pas la machine ?   

S. B. : C’est une sorte de ping-pong, avec la machine qui va toujours de l’avant. Mina Lee, qui fait un PhD sur l’intelligence artificielle à Stanford, me disait : « La machine ne va pas écrire à votre place mais elle va vous pousser à le faire. » Elle est l’un des nombreux scientifiques que j’ai rencontrés et qui imaginent des outils d’écriture, des interfaces qui permettent de dialoguer avec GPT-3. Elle a créé son propre outil, CoAuthor, très minimaliste et agréable à l’usage. Il n’a pas toutes les subtilités de réglage du playground d’OpenAI, mais soumet instantanément quatre propositions de ce que pourrait être la phrase à venir, là où OpenAI va livrer une seule version. On peut choisir celle qui nous plaît le plus. Chez OpenAI, le paramètre qui m’a vraiment intéressé, c’est la « température ». À zéro, la machine est la plus précise, la plus « prévisible », mais c’est ce qui va générer les textes les plus évidents. Si l’on monte le curseur à 1, la machine va prendre plus de liberté et aller vers des suggestions qui sont statistiquement moins probables, donc cela va créer des ruptures beaucoup plus étonnantes. Par exemple, on entre que le personnage traverse la rue, la machine va écrire : « Là, il se fait écraser, il rencontre un nouveau personnage à l’hôpital… ». Plus l’on monte la température, plus le récit va être improbable et unique. 

N'y a-t-il pas des limites ?  

S. B. : Le principal problème reste que cette machine s’est entraînée sur des textes libres de droits, tous ceux que l’on peut trouver sur le Web comme Wikipédia ou divers forums. Chez OpenAI, ils m’ont dit : « Envoie-nous des scénarios, et on pourra faire une version pour toi de GPT-3 qui sera entraînée sur les textes que tu souhaites. J’ai choisi 77 films américains que j’adore. Et puis ils m’ont dit qu’ils ne pouvaient pas le faire, parce que cela posait des problèmes de droits de reproduction. Autre limite, l’usage d’un algorithme est très coûteux pour l’environnement. Dès que l’on sollicite la machine, ça fait tourner des gigaordinateurs dans l’Iowa. Des milliards de tokens sont requis pour arriver à sortir une réponse, 25 mégawatts de ressources, alors que nous, quand on réfléchit, on fait tourner à peine 25 watts dans notre cerveau pour trouver une nouvelle idée ! Non seulement on consomme très peu, mais la capacité humaine d’imagination est quasi infinie, tandis que cette machine est finie. 

En effet de miroir, cela révèle les capacités de l’intelligence humaine.  

S. B. : Complètement. C’est ce qui m’a marqué en rencontrant Luc Julia, le concepteur de Siri qui travaille maintenant comme conseiller pour Renault en France. Jamais le deep learning ne pourra imiter le cerveau, m’a-t-il expliqué. Il cite l’exemple des énormes Jaguars blanches de Waymo à San Francisco, entourées de plein de caméras, avec un employé dedans au cas où quelque chose ne marche pas bien. Il y a cette vidéo où l’on voit la voiture s’arrêter, et avancer d’un mètre toutes les trente secondes. En fait, un type a volé un panneau stop et marche avec ce panneau à côté de la voiture. La machine bug, parce qu’elle n’a jamais été confrontée à cette situation. L’humain a une capacité d’improvisation et d’abstraction que la machine n’aura jamais. 

Est-ce la même chose pour l’écriture de scénarios avec l’algorithme ? 

S. B. : Il y a ce data scientist passionnant, Yves Bergquist, qui m’a bien résumé la situation : « Le problème de GPT-3, c’est que c’est de la régurgitation de mots. » Après une lettre a priori il y a cette lettre-là, après ce mot, ce mot-là, etc. Donc ce sont des maths, de la prédiction. On est bluffé par le résultat, mais c’est l’humain, au fond, qui parle derrière la machine. Yves est bien placé pour en parler : il a créé un algorithme, Corto, qui allie IA et récit de film ou de série. On rentre les détails de notre scénario, et, en fonction des mots-clefs, de nos personnages, etc., la machine analyse le marché et nous dit quelle est notre audience, quelle prise de risque pour des investisseurs, etc. On peut ensuite modifier, retravailler un personnage, et poursuivre l’écriture. Fascinant. 

Quelles sont les autres limites techniques d’OpenAI pour un auteur ?  

S. B. : Pour l’instant, on ne peut pas écrire des textes qui fassent plus d’une page. La machine n’est pas capable de générer le scénario entier. Et puis elle est quelque peu amnésique. Si, au début d’un film, deux personnages se font une promesse, la logique dramatique veut que la promesse soit rompue à un moment. GPT-3, lui, ne suit aucune structure, aucune logique dramatique, il va oublier la promesse. Chez OpenAI, on m’a dit qu’avec les nouvelles couches de réseaux neuronaux, d’ici deux ans, l’application serait capable de lire structurellement des textes avec un début, un milieu et une fin. Pour autant, la machine ne saura jamais cultiver les obsessions narratives, les failles qui caractérisent un auteur. Tous ont cette capacité à produire des émotions, des frustrations, des obsessions, des failles qui font que l’on va thématiser des récits, produire un propos et donc créer du sens, une parole. Quelque chose que l’on retrouve du début à la fin d’un film, une identité que la machine n’a pas. 

Quels autres algorithmes d’écriture vous ont intéressé ? 

S. B. : Amit Gupta a créé Sudowrite, la version la plus ergonomique. On est vraiment pris par la main, on a plusieurs outils, on peut lui demander de générer des idées particulières autour d’un thème ou d’un personnage. Jacob Vaus, un jeune réalisateur de 23 ans, a aussi inventé une déclinaison hilarante du processus, Solicitors, qui crée des films absurdes ou des recettes de cocktails complètement générés par des machines. C’est lui qui m’a appris comment parler à la machine. Si l’on s’adresse à GPT-3, il ne faut pas hésiter à lui dire : « J’ai besoin de générer des idées sur tel thème », comme si l’on avait face à soi un coauteur ou un script doctor. Avant de partir, on m’a parlé de PALM , la nouvelle invention encore plus puissante conçue par une chercheuse de MIT. Il y a aussi l’IA de Google que je n’ai pas utilisée. 

Quid de DALL·E ? L’avez-vous utilisé ? Qu’en pensez-vous ? 

S. B. : Andrew Mayne, cet écrivain de S.F. qui est devenu une sorte d’ambassadeur d’OpenAI, m’a montré comment ça fonctionne. Il a entré « Génère l’image d’un koala faisant du basket. » Le résultat était bluffant. C’est là où cela ne m’amuse plus du tout, si tout à coup on peut réaliser de manière artificielle des images en mouvement, cela empiète trop sur mes platebandes ! (rires). Blague à part, cela pourrait être super pour certains usages, comme faire un moodboard en prépa d’un film ; cela peut générer des images inouïes dans le décor de notre choix. 

Les œuvres de Simon Bouisson à découvrir :

Sa très belle série Stalk (prix du meilleur réalisateur au festival de fiction de la Rochelle 2019, en cours de remake outre-Atlantique), 3615 Monique (OCS) ou encore ses fictions interactives WEI OR DIE (Fipa D’or 2016) et République (Tribeca 2021).

Cet article est paru dans la revue numéro 31 de L'ADN. Tout un dossier est consacré à GPT-3, le modèle de langage. Franchement, et sans nous vanter, c'est passionnant. Pour vous procurer votre numéro, c'est l'histoire d'un clic.

commentaires

Participer à la conversation

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.