La récente mise à jour de l'intelligence artificielle générative permet la fabrication de synthographies (photographies synthétiques) difficilement distinguables d'une vraie photographie. La porte ouverte pour des fake news et une falsification de l'Histoire ?
Le pape qui porte une doudoune ultra-stylée, Macron qui ramasse des ordures ou défile avec les forces de l'ordre, Trump arrêté en pleine rue ou incarcéré en combinaison orange… Depuis une semaine, Twitter et LinkedIn sont régulièrement envahis d'images virales invraisemblables qui mettent en scène des figures médiatiques et politiques. Ces synthographies (le terme désigne les images photoréalistes générées par IA) ont toutes été réalisées via la cinquième et dernière version de Midjourney sortie le 20 mars dernier. Et elles sont si réalistes... qu'elles semblent bien réelles.
L'IA sait enfin dessiner des mains
Depuis la V4, on sait que Midjourney est devenu l'outil de prédilection pour les IArtistes voulant créer des images photoréalistes. Beaucoup l'avaient utilisé pour générer des images de films n'ayant jamais existé. Si les résultats esthétiques étaient phénoménaux en novembre, les internautes se sont vite lassés du côté « plastique » de la peau et des visages qui se ressemblaient tous un peu. Chaque publication était aussi l'occasion de revenir sur les glitchs, ces petites anomalies que l'on trouvait facilement en plongeant dans les détails de l'image : des doigts mal positionnés ou surnuméraires, des dents en plus, des positions corporelles qui n'ont aucun sens. Un coup d'œil un peu poussé permettait de repérer facilement ce type d'erreurs et donc de distinguer les fakes. Mais depuis la V5, les choses se sont corsées.
Faire de l'OSINT sur des images
Avec sa V5, Midjouney a particulièrement travaillé sur les projections de lumières, les réflexions et les ombres des synthographies. L'entreprise a aussi poussé l'entraînement de l'IA sur les lieux présentés. Midjourney peut capturer et restituer le look et l'ambiance d'une rue parisienne par exemple, chose qui était plus difficile auparavant. Enfin, les mains et le positionnement des corps se sont beaucoup améliorés tandis que l'esthétique un peu plastique que l'on retrouvait facilement dans la V4 tend à s'estomper. Concrètement, il faut plus qu'un simple coup d'œil pour percevoir la supercherie. Pour l'image du pape François par exemple, ce sont les lunettes ou bien l'étrange tasse à café qu'il tient à la main qui trahissent l'artificialité de l'image. Pour les photos de Macron, ce sont les visières des CRS qui mettent la puce à l'oreille. Il faut donc soit connaître la source primaire de l'image, soit faire un vrai travail d'enquêteur visuel pour trouver ce qui cloche.
Inventer de faux évènements historiques
À ce jour, aucune synthographie n'a été utilisée sciemment comme fausse information, mais ces images sont déjà au centre d'un nouveau hobby : la fabrication d'évènements historiques totalement fictifs. Sur le subreddit r/Midjourney les internautes s'amusent à imaginer ce qu'aurait donné un blackout géant causé par une tempête solaire en 2012 ou la fameuse « peste bleue » qui s'est déroulée dans les années 70 en URSS. Cette falsification de l'Histoire, même si elle est artistique, interroge forcément. Donner la capacité à n'importe quel internaute d'inventer ou de modifier l'Histoire... est-ce réellement une bonne idée ? Il faudrait peut-être poser la question à ChatGPT...
As I grew up in the 50's - 60's I continuously heard... don't believe everything people tell you, don't believe everything you read and only trust 1/2 of what you see. Today, it's absolutely TRUE... you can't believe and trust ANYTHING from ANYBODY... even if they're a "self-proclaimed" expert in one field or another ! Unfortunately, we are creating and reinforcing a society of cynics.