Qu'il s'agisse des dessins ou des synthographies, les images générées par Midjourney et Stable Diffusion comptent de moins en moins de défauts visuels. De quoi chagriner des artistes qui cherchent justement cette imperfection.

Tous les jours depuis près de six mois, l'artiste Albertine Meunier poste une image sur Twitter. Il s'agit systématiquement d'une dame d'âge mûr, au look vaguement britannique, en train de déguster une assiette de saucisse frites. Générée sur Dall.E, ces photos sont immédiatement identifiables comme étant le produit d'une intelligence artificielle. Les visages sont fondants, les bijoux et la peau se mélangent et les bouches sont parfois tellement difformes qu'on a l'impression que les saucisses sont remplacées par des langues énormes. Pourtant, contrairement à ce qu'on pourrait croire, la génération de ces images pleines d'aberrations visuelles et de glitchs est de plus en plus difficile à obtenir. « Dall.E est régulièrement mis à jour et ne permet pas à ses utilisateurs de revenir à une précédente version, explique l'artiste. Étant donné que je cherche des images imparfaites, je dois en générer une centaine pour trouver un résultat qui me convient. »

La perfection d'un pape en doudoune

La tendance de fond semble effectivement s'éloigner des recherches esthétiques d'Albertine. Midjourney notamment donne le la vers une amélioration photoréaliste des modèles. Les synthographies (photographies synthétiques) du pape en doudoune ou d'un manifestant âgé tabassé par la police ont fait prendre conscience au monde entier qu'il devenait de plus en plus difficile de faire la distinction entre vrai et faux. Quelques mois plus tôt, les artistes se clashaient sur Twitter parce que les personnages générés par IA possédaient des mains difformes avec des doigts en plus ou des positions de corps impossibles et absurdes.

« Les modèles tendent vers le photoréalisme parce que la génération d'image par IA est avant tout un business, explique Takyon236, artiste et développeur au sein de Stablilty.ai, la firme derrière Stable Diffusion. Ils collent aux désirs de la majorité des utilisateurs qui veulent des choses qui se rapprochent de ce qu'ils connaissent déjà, comme la photo. Ces business veulent avoir des résultats très qualificatifs pour éviter d'être considérés comme un sous-médium. »

À la recherche de l'imperfection

Ce n'est pas parce que les IA savent correctement dessiner des mains que les artistes vont s'en contenter. Sur le discord Unstable Diffusion, plutôt connue pour ses artistes spécialisés dans la génération d'images pornographiques, deux sections intitulées Failed-gens et Synthetics Horrors répertorient des œuvres comprenant des aberrations visuelles, plus pour s'en moquer que pour les célébrer. De son côté, Albertine continue de vouloir échapper à la tyrannie de la perfection. En sélectionnant des clichés pleins de glitchs, elle dit vouloir préserver une forme de poésie attendrissante venant de la machine. « Un peu à la manière des photographes qui utilisent de vieux appareils photos numériques pour donner un côté nostalgique à leurs clichés, les artistes qui ont connu les premiers modèles ont tendance à vouloir utiliser les premiers générateurs d'images qu'ils ont utilisés pour retrouver les sensations du début », précise-t-elle. Pour Takyon, il est tout à fait possible que cette course au photoréalisme s'arrête une fois un certain palier atteint. « Quand il sera impossible de faire la différence entre une vraie photo et une synthographie, les gros constructeurs de modèles iront peut-être dans une autre direction plus créative, prophétise-t-il. En attendant, je vois de plus en plus de créateurs, dans le domaine de la mode notamment, s'inspirer de l'esthétique IA un peu imparfaite que l'on trouvait en 2022. Je pense qu'à terme l'IA ne sera plus vue comme un outil, mais comme une nouvelle manière de s'exprimer en elle-même. »