Les contenus cheap produits par IA explosent et les marques les financent à leur insu

Par Marine Protais - Le 29 juin 2023

Accueil > Tech à suivre > Les contenus cheap produits par IA explosent et les marques les financent à leur insu

Selon une nouvelle étude de NewsGuard, 141 marques voient leurs pubs placées sur des sites générés par intelligence artificielle. De quoi ébranler un peu plus le modèle économique du Web ?

Le Web est vérolé par toutes sortes de contenus de mauvaise qualité produits par les intelligences artificielles générative s. On s'y attendait, et les preuves s'accumulent. Un rapport de l’organisation NewsGuard révèle que des sites dont le contenu est « synthétique » accueillent des publicités de marques reconnues. 141 enseignes seraient concernées.

Le rapport ne cite pas de noms, mais dit avoir vu des publicités de constructeurs automobiles, de banques, de magasins de luxe, d’e-commerces internationaux, d’une grosse chaîne de supermarchés européenne, d’équipementiers sportifs... Aucune des 40 entreprises contactées par NewsGuard n’a souhaité répondre. L’organisation a identifié ces pubs en naviguant sur le Web depuis 4 pays : les États-Unis, l’Allemagne, l’Italie et la France.

Fermes de contenus nouvelle génération

A priori ces marques ne sont pas au courant que leurs publicités sont affichées sur ces sites (et c’est pour cette raison que NewsGuard ne les cite pas). Ces encarts ont été attribués de manière automatique. Il s’agit de publicité programmatique. L’emplacement des publicités est attribué par des bots selon les critères sélectionnés par l’annonceur. Ces publicités sont pensées pour suivre l’utilisateur en ligne. Ce sont par exemple les fameuses bannières pour le canapé que vous avez eu le malheur de regarder un jour et que vous retrouvez ensuite partout où vous naviguez sur le Web. Google est l’un des principaux acteurs qui gèrent l’attribution de ces publicités. Dans le cas de l’étude de NewsGuard, l’entreprise est à l’origine du placement de 90 % des publicités repérées par l’organisation.

Des contenus cheap à foison pour attirer la pub : le concept n’est pas nouveau. C’est déjà l’idée derrière les fermes de contenus, ces sites remplis d’articles putaclics dont l’unique but est de générer des revenus publicitaires. Google dit pourtant pénaliser ces productions non qualitatives. Mais selon une étude américaine de 2022, les fermes de contenus sont à l’origine de 21 % des impressions publicitaires (c’est-à-dire de l’affichage). L’une des raisons qui fait dire à Tim Hwang, ex de Google et auteur du Grand krach de l'attention (C&F, 2022), que la publicité en ligne est une bulle qui finira par exploser. La différence ici réside dans la façon de produire ces contenus. Auparavant les articles étaient écrits par des humains, des pigistes souvent mal payés. Aujourd’hui ils sont donc remplacés par des robots (qui sont eux-mêmes entraînés par d’autres humains, eux aussi mal payés). Ce qui baisse le coût de fabrication de ces sites, mais pas drastiquement selon MIT Technology Review.

1 200 articles par jour, qui dit mieux ?

C’est peut-être la quantité produite qui change réellement. Car le nombre d’articles publiés par ces IA est faramineux. World-Today-News.com publie par exemple environ 1 200 articles par jour. Contre 150 pour le New York Times (rédaction de 1 700 journalistes), compare le rapport. On y trouve des articles sur le dernier téléphone Samsung, des analyses du marché immobilier, des actualités sur les émeutes en France, ou encore sur la situation en Russie.

NewsGuard dit comptabiliser environ 25 nouveaux sites synthétiques par semaine. Leur qualité varie, certains poussent la ressemblance avec un vrai site d’info plus loin en insérant des biographies de faux auteurs. La plupart n’apportent rien mais ne font pas de désinformation, pointe Newsguard. Beaucoup plagient le travail de vrais journalistes en reprenant et adaptant des articles déjà publiés ailleurs. Quelques-uns sont encore plus problématiques. Notamment un site baptisé Medical Outline.com, faisant la promotion de méthodes non prouvées « naturelles » pour prévenir un cancer, ou pour traiter des allergies.

Pour les repérer, l’organisation détecte les traces laissées par les IA. Notamment les phrases du type : « En tant qu’intelligence artificielle je ne peux pas donner mon opinion », que l’on retrouve souvent en posant une question à ChatGPT par exemple.

Les IA vont-elles tuer le vieux Web ?

Quelle est la conséquence de ce nouveau type de contenus pour l’économie numérique ? Cela pourrait potentiellement porter atteinte à la publicité programmatique, ressort économique d’Internet. Reste à savoir si ces sites sont réellement consultés par les internautes, et donc captent une partie importante des revenus publicitaires des sites légitimes.

Le média The Verge va plus loin. Selon la parution américaine, l’avènement des contenus générés par IA est en train de « tuer le vieux Web ». « Cela pourrait endommager des pans entiers du Web que la plupart d'entre nous trouvent utiles, qu'il s'agisse d'avis sur des produits, de blogs de recettes, d'organes d'information ou de wikis. Les sites pourraient se protéger en faisant payer l'accès, mais cela signifierait une énorme réorganisation de l'économie du Web ». De quoi réinventer de nouveaux modèles de média ?