
Dans la course à l'IA, les entreprises chinoises sont confrontées à un défi majeur : s'assurer que les chatbots reflètent les valeurs socialistes du Parti Communiste.
Soucieux d'encadrer l'usage de l'intelligence artificielle, le gouvernement chinois travaille sur un chatbot formé à la pensée de Xi Jinping, président de la République populaire de Chine. L'effort visant à garantir l'alignement des IA génératives à la philosophie du Président intervient alors que les responsables chinois tentent de trouver un équilibre entre deux forces : contrôles draconiens de la liberté d'expression, et promotion du développement de l'IA pour rivaliser avec les outils développés aux États-Unis. Pour le Financial Times, l'application, surnommée avec humour « Chat Xi PT », est la « dernière réponse chinoise à OpenAI ».
La Chine veut encadrer l'intelligence artificielle
Officiellement, le chatbot déployé par le Cyberspace Administration of China (CAC), organisme chargé de réguler l’Internet chinois, est destiné à fournir des recherches sur la cybersécurité et les technologies de l'information. Il tire ses données de sept sources. Les premières sont des bases de données professionnelles. La septième est la doctrine, officiellement connue sous le nom : « Pensée de Xi Jinping sur le socialisme à la chinoise pour une nouvelle ère » . Aussi appelée Xiisme, elle présente les idéologies politiques et économiques développées du Président Xi Jinping, considéré comme le leader chinois le plus autoritaire et le plus répressif depuis Mao. À ce jour, le nouveau modèle est uniquement utilisé dans un centre de recherche sous l'égide du puissant régulateur d'Internet chinois. La création de ce nouveau LLM (Grand modèle de langage) s'inscrit dans la continuité de la volonté des responsables chinois de diffuser largement les idées de Xi Jinping sur la politique, l'économie et la culture.
Menace pour le récit du Parti Communiste Chinois
Dans la guerre de l'intelligence artificielle où Chine et États-Unis se disputent le leadership, les Américains ont un avantage de taille. L’IA générative se nourrit de grands volumes de données, dont la quantité et la qualité forment le socle de leur efficacité. Si ChatGPT (OpenAI) ou Bard (Google) sont entraînées à partir de données disponibles et puisées sur Internet, les développeurs chinois d’IA sont confrontés à un grand nombre de restrictions. Le CAC, qui édicte des règles strictes pour encadrer le développement des IA génératives, exige que les fournisseurs « incarnent les valeurs socialistes fondamentales », et indique que le contenu généré ne peut « contenir aucun contenu qui subvertit le pouvoir de l’État. » Une approche qui ne surprend pas Gianluigi Negro, chercheur à l’université de Sienne et expert de la gouvernance chinoise d’Internet : « Dans les années 1990, lorsqu’Internet a émergé en Chine, le pouvoir a tout de suite compris qu’il s’agissait à la fois d’une opportunité économique exceptionnelle, mais aussi d’une menace pour l’ordre public qu’il fallait contrôler. »
Un avis partagé par Rebecca Arcesati, analyste au Mercator Institute for China Studies (MERICS). Selon elle, à Pékin, les IA génératives représentent un risque pour le système social et le narratif du Parti communiste chinois : « Il est important de dissocier les inquiétudes du gouvernement chinois de celles de la société civile. Certes, les dérives de l’IA susceptibles de nuire aux citoyens sont considérées par l’État. Mais sa crainte principale, c’est la diffusion d’informations indésirables aptes à déstabiliser le pouvoir. » Un contrôle et des restrictions qui représentent un véritable défi pour les entreprises chinoises. En effet, en raison de la faible quantité de données disponibles en chinois, la plupart des entreprises entraînent également leurs chatbots sur des ressources en anglais, introduisant ainsi le risque de contrevenir aux règles de la CAC.
Assouplir les règles pour gagner en compétitivité
Pourtant, les ambitions de la Chine sont considérables dans cette course à l'IA. En 2017, le Conseil des affaires d’État avait annoncé son intention de devenir une superpuissance incontestée dans le domaine d’ici 2030. Des ambitions qui ont contraint le CAC à revoir sa copie. Le Financial Times rapporte que la Cyber Security Association of China, une organisation à but non lucratif alignée sur le CAC, a publié en décembre la première base de données publique de 100 millions d'entrées de « données fiables et de haute qualité ». Un corpus à destination des entreprises et des centres de recherche. « L’évolution des projets de législation sur le sujet montre bien que les autorités chinoises ont pris conscience [de leur retard] », indique Angela Zhang, spécialiste du droit chinois à l’université de Hong Kong. Les autorités chinoises se concentrent désormais sur le contrôle des données utilisées pour entraîner et former les modèles de langages. Objectif : s’assurer de leur véracité, tout en écartant à la source toute information non désirable.
Cette nouvelle stratégie sera-t-elle suffisante pour permettre à la Chine de devenir une superpuissance incontestée de l'IA d’ici 2030 ? Pas si sûr. L'ensemble de la base de données s'inspire largement de réglementations et de documents politiques du gouvernement. D’après le Financial Times, l’un de ces documents contiendrait 86 314 références à Xi Jinping... « Les Américains ne devraient pas être effrayés par le spectre d’une émergence chinoise spectaculaire sur l’IA. (…) Lorsque l’on parle de grands modèles de langages, la Chine accuse non pas des mois, mais des années de retard derrière ses compétiteurs internationaux », indique Helen Toner, directrice de la stratégie au Centre pour la sécurité et les technologies émergentes de Georgetown.
Participer à la conversation