OpenAI demande à Trump l’autorisation d’exploiter les œuvres protégées par le droit d’auteur

OpenAI demande à Trump l’autorisation d’exploiter les œuvres protégées par le droit d’auteur

D’ici juillet, une loi passée par l’administration Trump permettra à OpenAI de contourner le droit d’auteur pour entraîner ses IA.

On le sait depuis plusieurs années, les larges modèles de langage se sont construits en absorbant massivement le travail des humains, et pas toujours de la manière la plus propre et légale qui soit. Alors qu’OpenAI fait l’objet de plusieurs actions en justice pour avoir utilisé des textes protégés par le droit d’auteur à des fins d’entraînement de ses IA, son PDG, Sam Altman, a publié sur le site de l’entreprise des recommandations à destination de la Maison-Blanche. Ces recommandations, « axées sur la liberté », s’inscrivent dans le cadre d’une consultation publique censée alimenter la mise en place, en juillet 2025, du plan d’action de Trump pour l’IA.

Les limites du fair use

D’après OpenAI, ses modèles de langage « sont entraînés à ne pas reproduire les œuvres destinées au public », mais plutôt à extraire « des schémas, des structures linguistiques et des informations contextuelles ». De ce fait, l’entreprise considère que ses IA respectent « les objectifs fondamentaux du droit d'auteur et de la doctrine de l'usage équitable, en utilisant des œuvres existantes pour créer quelque chose de totalement nouveau et différent, sans en altérer la valeur commerciale ».

En résumé, OpenAI demande la permission à Donald Trump d’exploiter ouvertement tous les textes protégés par des droits d’auteur en vertu des règles américaines du fair use. Ces dernières autorisent la citation d’œuvres sous copyright dans le but de les critiquer, de les commenter, de les utiliser à des fins pédagogiques et éventuellement pour « d'autres usages ».

La justice commençait à faire son travail

Depuis ses premières versions, l’entraînement du modèle GPT repose sur l’exploitation de bases de données contenant des corpus de textes massifs. Ces derniers proviennent du scraping de pages web et de Wikipedia, de livres numérisés sous licence ouverte ou de conversations Reddit mises en avant par la communauté. Pendant longtemps, OpenAI a clamé une utilisation légale du scraping en exploitant des données libres ou sous licence. Mais au début de l’année 2024, l’entreprise a fini par admettre qu’il lui serait impossible de former ses outils d'IA sans utiliser de matériel protégé par le droit d'auteur.

Il faut dire que la fin de l’année 2023 a été marquée par une série d’actions en justice contre OpenAI pour violation du droit d’auteur. Le New York Times, le Daily Mail, la BBC, Raw Story ou encore The Intercept accusent l’entreprise d’avoir pillé leurs publications en ligne pour alimenter ses modèles. OpenAI s’est d’ailleurs retrouvée dans une situation délicate après une décision de justice récente donnant raison aux titulaires de droits d’auteur qui contestaient l’usage équitable de l’entraînement des intelligences artificielles.

Manger les livres pour lutter contre la Chine

OpenAI n’est pas la seule entreprise à vouloir voir disparaître le droit d’auteur. Le 21 mars, des documents judiciaires ont révélé que Meta s’était octroyé le droit de télécharger l’intégralité du site Library Genesis, une bibliothèque pirate en ligne contenant 7,5 millions de livres et 81 millions d'articles de recherche. Là encore, Meta a invoqué le fair use pour justifier l’entraînement de ses modèles d'IA générative sur des œuvres protégées par le droit d'auteur sans licence, en argumentant que les LLM « transforment » le matériel original en une nouvelle œuvre.

Englués dans des affaires judiciaires sans fin, les géants de l’IA jouent donc leur va-tout avec Trump en avançant un argument imparable : si leur « liberté d’apprentissage » est entravée, la Chine et ses larges modèles de langage prendront l’avantage en exploitant les œuvres de leur côté. « Si les développeurs chinois bénéficient d'un accès illimité aux données tandis que les entreprises américaines s’en voient privées, la course à l'IA est bel et bien terminée », affirme OpenAI noir sur blanc.

David-Julien Rahmil

David-Julien Rahmil

Squatteur de la rubrique Médias Mutants et Monde Créatif, j'explore les tréfonds du web et vous explique comment Internet nous rend toujours plus zinzin. Promis, demain, j'arrête Twitter.

Discutez en temps réel, anonymement et en privé, avec une autre personne inspirée par cet article.

Viens on en parle !
commentaires

Participer à la conversation

Laisser un commentaire