
Aucun procès n’a encore inquiété les entreprises derrière les intelligences artificielles. Le NYT va-t-il changer la donne ?
Le 27 décembre dernier, le New York Times annonçait dans son propre média le dépôt d’une plainte contre Open AI et Microsoft pour violation du droit d’auteur. D’après le dossier déposé au tribunal fédéral de Manhattan, des millions d’articles publiés par le New York Times auraient été utilisés pour entraîner ChatGPT. Les deux entreprises sont accusées d’avoir causé des « milliards de dollars de dommages-intérêts légaux et réels » liés à « la copie et l'utilisation illégales des œuvres d'une valeur unique du New York Times ». Microsoft qui est partenaire d’Open AI est visé à cause de son service Copilot, une assistance intégrée dans la suite Office qui est alimentée par plusieurs grands modèles de langage. La plainte indique que ces systèmes pourraient très bien générer de fausses informations (les fameuses hallucinations d’IA) et attribuer ces dernières au NYT, ce qui entacherait la crédibilité du média.
Les procès, c'est comme les avions de chasse...
C’est la première fois qu’un média de cette envergure lance ce genre d’attaque, mais il ne s’agit pas de la seule procédure en cours. En septembre 2023, plusieurs romanciers comme John Grisham, Elin Hilderbrand, George RR Martin, ou Michael Connelly ont déposé une plainte commune avec la Authors Guild, (l’une des plus anciennes organisations américaines d’auteurs) contre Open AI et Microsoft pour le viol de leurs droits d’auteur. D’après cette dernière, les chatbots d’Open AI sont capables de produire des « œuvres dérivées » en reprenant le style d’un auteur ou en créant des résumés d’ouvrages.
En janvier 2023, c’était Getty Image qui attaquait Stable Diffusion après avoir découvert que certain prompts faisaient ressortir le logo de l’agence photographique sur les synthographies (des photographies artificielles générées par l’IA). Pour ces deux cas, l’argumentation des entreprises concernées est toujours le même : l’IA s’appuie sur des bases de données gigantesques constituées par des ONG comme Common Crawl qui scannent l’intégralité du Web à des fins de recherche. Une fois passé à la moulinette de puissant algorithme, le contenu des bases est effacé et seuls les résultats des calculs sont gardés. C’est un peu comme si les IA avaient « digéré » le contenu pour n’en garder que des éléments dissociés pouvant être reconstitués. En réalité, il s’agit surtout d’une forme de blanchiment de données.
Repousser les limites du droit d'auteur
Cet argumentaire selon lequel, les IA ne copient pas « vraiment » le contenu des bases de données a d’ailleurs été récemment mis à mal sur la partie visuelle. Au moment où Midjourney annonçait la sortie de sa V6, une discussion interne à l’entreprise datant de 2022 a fuité en ligne. Cette dernière montre que les équipes ont créé une base de données contenant 16 000 noms d’artistes sur laquelle le modèle était formé. Cette base a été ensuite « blanchie » via l’entraînement, rendant virtuellement impossible toute attaque pour viol de droit d’auteur.
Dans le sillage de cette fuite, les utilisateurs de Midjourney ont repéré un autre problème potentiel. Depuis sa mise à jour, l’IA générative n’hésite pas à créer, sans qu’on lui demande précisément, des personnages très connus et protégés par des copyrights comme Dark Vador ou Mickey Mouse sans que cela soit véritablement attaquable par les ayants droit. Autrement dit, ces entreprises ont réussi à mettre en place un cauchemar éthique et juridique dont il va être très difficile de sortir. Dans l’article qui annonce la plainte du New York Times, l’ancien directeur de rédaction de l’ONG ProPublica et consultant auprès du secteur de l'information, Richard Tofel estime que les IA ont repoussé les limites des droits d’auteur comme l’a fait en son temps la radio ou le logiciel de partage de fichiers Napster (qui avait voulu légitimer son activité de partage gratuit de fichiers musicaux en mettant en avant la protection de l'Audio Home Recording Act – qui permet la copie à usage privé). Selon lui, « une décision de la Cour suprême est essentiellement inévitable » à la fin de ces procès en cours.
Bonsoir,
Bravo pour cet article !
J'ai indiqué son lien sur ma page intelligence artificielle https://desthematiques.wordpress.com/?p=20275 et sur celle du 27 décembre 2023 https://cejour.home.blog/?p=59168
C'est en cherchant des informations sur sky cruise et en découvrant que votre article était paru le 22 juin 2022 alors que les autres (futura sciences, l'usine nouvelle ou même ouest-france dataient du 2 du 5 ou du 8 juillet) que je me suis un peu plus intéressée à vos articles et à ce site !
Bien cordialement,
Bernadette Couturier
Blogs : https://cejour.home.blog/
et https://desthematiques.wordpress.com/blog/