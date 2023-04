L’intelligence artificielle devient un nouvel outil créatif pour les communautés de fans qui créent de faux extraits audios à partir du site ElevenLabs, brouillant une fois de plus la frontière avec le réel.

Taylor Swift en roue libre ? Sur TikTok, on peut l’entendre proférer des insultes. « J’en ai rien à foutre si mes billets de concert se vendent pour plus de 1 000 dollars, je ne fais pas de concerts pour les pauvres salopes. » Ou encore : « Quoi de neuf les salopes ? Si votre album est Evermore, vous n’avez pas de goût ». Évidemment Taylor Swift, la vraie, n’a jamais méprisé ses fans (et sa propre musique) de la sorte. Mais la copie de sa voix générée par intelligence artificielle, oui.

Depuis quelques mois, des fans de la pop star mettent en ligne des vidéos mêlant des images de concerts ou de clips et une voix générée grâce au logiciel ElevenLabs, rapporte The Atlantic. Sur TikTok toujours, ils s’échangent des astuces pour utiliser cette plateforme lancée en janvier dernier. Ce logiciel en ligne permet de créer des voix artificielles en choisissant différents paramètres : voix féminine ou masculine, ayant un accent plutôt anglais ou australien… Contre 5 dollars par mois, il est possible de « cloner » une voix grâce à un extrait sonore de quelques secondes. Le résultat est assez convaincant, pour une courte vidéo en tout cas.

« Faites attention les gars »

Les propos tenus par la fake Taylor Swift laissent peu de place au doute. Il aurait été peu probable d’entendre cette artiste, qui a l’habitude de choyer ses fans, leur manquer de respect. D’autant qu’ici le processus est collectif : il s’agit de fausses vidéos – dont le côté faux est pleinement assumé – de fans pour d’autres fans. L’IA est un nouvel outil créatif, explique Andrea Acosta, doctorante à l'UCLA qui étudie les fandoms. Tous ne sont toutefois pas ravis de la propagation de cet outil. « C’est effrayant », « faites attention les gars, on n’a pas besoin de drame inutile », peut-on, par exemple, lire en commentaires de certaines vidéos.

Ces vidéos donnent un aperçu, estime The Atlantic, de la manière dont ces voix générées par IA pourraient brouiller les pistes entre réel et faux. De la même manière que les images créées avec Midjourney d’un pape en doudoune blanche ou d’un vieil homme battu par des policiers, perturbent les réseaux sociaux ces derniers jours.

ElevenLabs prétend faire attention aux types de contenus produits grâce à sa technologie, afin d’éviter des propos toxiques (c’est un peu raté pour Taylor Swift). Mais le processus semble pourtant assez direct lorsque l’on souhaite créer un extrait sonore.

Will Smith et les spaghettis

Et que pense Taylor Swift de tout ça ? Son équipe n’a pas souhaité donner son avis à The Atlantic, ni à 20 Minutes qui a également enquêté sur le sujet début mars. Mais les fans sont eux persuadés qu’elle écoute leurs créations. « ELLE A ÉCOUTÉ L’AUDIO ! », s’est exclamé une fan après que le compte officiel de la chanteuse a liké sa vidéo.

On peut imaginer que ces voix trafiquées soient appliquées à des vidéos entièrement générées par intelligence artificielle à partir d’un simple texte. Ces derniers jours, une vidéo de Will Smith s’empiffrant de spaghettis a été vue 8 millions de fois sur Twitter après avoir été publiée sur Reddit lundi 27 mars. Celle-ci a été créée grâce à Modelscope, une plateforme chinoise où différents outils de génération d’images sont disponibles. Pour le moment, le rendu est assez étrange, et laisse peu de doute sur l’irréalité de la scène. Mais il est possible que la qualité du text-to-video évolue aussi rapidement que celle du text-to-image. À l’automne 2022, les images générées par Midjourney et Stable Diffusion laissaient des traces grossières de leur fabrication par une machine (mains à cinq doigts et visages des enfers). Et six mois plus tard, une photo hyperréaliste (mais fausse) du pape François à l’aise en doudoune blanche sème le doute chez les internautes.

Avant l’explosion des IA génératives, des vidéos deepfakes de célébrités circulaient déjà sur le Web. Deep Tom Cruise et Unreal Keanu Reeves clairement estampillés « comptes parodiques » ont déjà pignon sur TikTok depuis quelques mois. Mais la facilité d’accès à des voix et images factices contre quelques dollars démocratise la présence de ces contenus 100 % synthétiques.