Illustration d'un homme qui se tire une balle dans le pied devant un mur d'écrans de TV

Les médias qui signent des accords avec OpenAI se tirent-ils une balle dans le pied ?

De plus en plus de médias signent des accords avec OpenAI, afin de laisser l'entreprise puiser dans leurs articles... pour entraîner son LLM.

Le 29 mai dernier, les journalistes du média The Atlantic découvraient que leur PDG Nicholas Thompson avait signé un accord de collaboration avec OpenAI. Contre une somme d'argent non dévoilée, le journal en ligne permet au géant de l'intelligence artificielle d'utiliser les articles mis en ligne depuis plusieurs années pour alimenter son large modèle de langage (LLM). Mais la nouvelle n'a pas soulevé l'enthousiasme de la rédaction qui a publié dans la foulée un article évoquant cet accord, comme un « contrat passé avec le diable » .

OpenAI, le nouveau bienfaiteur de la presse ?

Dans un contexte où les médias sont dans une recherche perpétuelle de nouveaux modèles économiques, un accord avec ChatGPT pourrait paraître une aubaine. Pourtant les journalistes de The Atlantic y voient plus une balle dans le pied, dans la mesure où les LLM sont en train de redéfinir l'accès à l'information. Conçus comme des « moteurs de réponses », les outils comme ChatGPT apportent la promesse d'une recherche Web prémâchée, où les internautes n'auraient plus besoin de filtrer, trier et parcourir les sites Web pour trouver une information. Si le PDG de The Atlantic affirme que le contenu protégé par un paywall ne se retrouvera pas copié ou reproduit dans les résultats de ChatGPT, on se demande de quelle manière les informations scrappées par l'IA vont être filtrées et présentées. Car dans les faits, il est bien prévu que les IA s'appuient sur les éléments d'informations présents dans les articles pour étayer des réponses.

Cette vision de moteur de réponses va d'ailleurs bien plus loin que de simples histoires de plagiat. Google est en train de mettre en place des résumés automatiques d'articles qui pourraient représenter, à terme, un danger pour les sites Web qui verraient leur audience s'effondrer. S'ajoutent à cela les problèmes habituels des intelligences artificielles, avec la génération de fausses informations ou bien l'utilisation non éthique de ces outils pour plagier des articles et capter ainsi les revenus publicitaires. De manière plus générale, ce type d'accord est souvent comparé aux deals conclus il y a quelques années, entre Facebook et les sites de presse, qui voyaient déjà leurs revenus passer dans l'escarcelle du réseau social en plus que de devoir s'acquitter d'un travail de fact-checking ou de création de contenu vidéo alimentant son fil d'actualités. Cette époque paraît aujourd'hui lointaine, tant la collaboration entre Meta et les rédactions s'est détériorée. À présent, les médias comme BuzzFeed qui avaient axé leur stratégie sur une publication uniquement sur les réseaux sociaux ont disparu. Même chose avec Google qui avait signé un accord avec le Wall Street Journal pour inciter à la production de vidéos à destination de YouTube. Après la fermeture récente de ce programme, le journal s'est séparé de 11 journalistes. Depuis le début de l'année 2024, plus de 830 journalistes ont été licenciés aux États-Unis tandis que l'on comptait 21 400 pertes d'emplois dans les médias en 2023.

On n'a pas le choix

Cette impression de voir l'ogre technologique dévorer le contenu, et le cracher à volonté en raflant la valeur au passage ne freine pas les médias qui acceptent ce genre de deals. Les survivants du secteur ont donné leur accord : les agences de presse Reuters et Associated Press (AP), les groupes de presse News Corp (Wall Street Journal et le New York Post), Prisa (El País et le HuffPost espagnol), Axel Springer (Die Welt et les sites Business Insider et Politico). En France, le journal Le Monde a été le premier à rejoindre le giron d'OpenAI.

Au début de l'année 2023 pourtant, le temps était à la contre-attaque. Le New York Times ou l'agence Getty s'étaient retournés contre OpenAI et Stable Diffusion après avoir découvert que ces entreprises avaient entraîné leur IA avec du contenu protégé par le droit d'auteur. Mais face à une entreprise valorisée à plus de 80 milliards de dollars, le combat est difficile à mener. C'est en substance ce qu'indique Raphaëlle Bacqué, journaliste et présidente de la société des rédacteurs du Monde. « On sait depuis longtemps que notre contenu est pillé par les grandes entreprises d'intelligence artificielle, explique-t-elle. On n'a malheureusement pas beaucoup de solutions contre ce problème. Soit on les laisse faire sans rien dire, soit on se fait payer. On se rend bien compte que c'est un pis-aller et une menace pour le journalisme, mais vu le comportement de ces boîtes qui sont hors de contrôle, on n'a pas vraiment le choix. Je pense que c'est le constat d'une grande partie de la presse internationale qui signe ces accords. »

Malgré cet apparent manque de choix, rappelons que le New York Times a mis à jour ses conditions d'utilisation pour interdire le pillage de son contenu à des fins d'entraînement des IA. La décision du Monde est mal vue par une partie des acteurs de la presse française. Pour Emmanuel Parody, associé du groupe Frontline Media, éditeur de Mind Media et Secrétaire général du Think Tank Le Geste qui regroupe 140 éditeurs en ligne, ces accords sont « un non-sens industriel » de la part des entreprises comme OpenAI. « Soit c'est purement cynique et politique, soit cela vise à s'offrir un vernis de crédibilité, explique-t-il sur le site du Geste. Mais je ne m'explique pas l'intérêt purement industriel d'un accord avec un ou quelques acteurs alors qu'il faut nécessairement accéder à des corpus de sources spécialisées les plus larges possible. » Que ce soit le début d'un mouvement plus général, ou le début d'une guerre entre médias et IA, une chose est certaine : l'IA risque bien de tout submerger.

Discutez en temps réel, anonymement et en privé, avec une autre personne inspirée par cet article.

Viens on en parle !
commentaires

Participer à la conversation

Laisser un commentaire