Grâce à l’IA, des historiens peuvent déchiffrer l'indéchiffrable

Par Marin Tézenas du Montcel - Le 5 avril 2022

Accueil > Tech à suivre > Grâce à l’IA, des historiens peuvent déchiffrer l'indéchiffrable

Et si les machines pouvaient interpréter l’Histoire ? On n’en est pas encore là, mais presque. Baptisée Ithaca, cette IA est capable de compléter les textes anciens et de leur donner sens.

Qu’il s’agisse d’une stèle, d’un vase ou d’un vieux parchemin, comment faire pour interpréter ce qui est inscrit quand l’objet étudié est trop endommagé par le temps ? En collaborant avec des universitaires d'Oxford, Google DeepMind est parvenu à créer une intelligence artificielle capable d’assister le corps scientifique dans son travail d’interprétation. Leur travail a été publié début mars dans la revue Nature.

Aux grands « mots », les grands remèdes

D’une poterie à un papyrus, les dégâts générés par le temps sont parfois si importants que de grandes parties de texte sont indiscernables, ou même complètement absentes. De nombreux chercheurs se sont alors spécialisés en épigraphie (l'étude des inscriptions gravées) dans l’optique de leur donner un sens. Le fait est que plus les trous sont béants, plus les solutions sont multiples et demandent un temps d’étude considérable. Et interpréter l’Histoire au fil d’un jeu de devinettes, c’est un peu imprudent.

C’est là que DeepMind, une entreprise spécialisée dans l’IA, entre en jeu. Aidée par les chercheurs de l’Université d’Oxford, l’entreprise a d’abord lancé le développement de Pythia, un outil de restauration de textes anciens entièrement basé sur une collection de 35 000 textes déjà recensés (soit l’équivalent de 3 millions de mots). À force d’entraînement, Pythia parvient à donner une vingtaine de solutions aux textes dont il manque des bribes, tout en évaluant la probabilité ente chaque solution avec une précision certaine. Quel avantage à ce stade ? Un pourcentage d’erreur à hauteur de 30 %, et un gain de temps considérable en sachant que ce travail prédictif ne prend que quelques secondes à la machine pour être effectué.

Lancés en si bon chemin, les mêmes chercheurs ont prolongé la force de cet outil avec Ithaca, capable non seulement de proposer différentes solutions pour un fragment de texte manquant, mais également de déterminer l’origine géographique du texte et sa date de création probable. Tout cela avec un pourcentage d’erreur à 38 % (contre 75 % chez l’humain).

L’espoir d’une collaboration entre machine et humain

Dans le cas précis, pas question de remplacer qui que ce soit. Au fil de leur démarche, les chercheurs ont tenu à confirmer le rôle d’assistance de ces outils. Le fin mot d’une interprétation revient toujours à l’équipe de chercheurs et à son recul. Depuis le début des opérations, de nombreux débats historiques sur des dates ou des provenances de sources ont été résolus à l’aide de ces outils. Associée à la force du regard humain, Ithaca aurait une efficacité interprétative de 72 %. Enfin un emploi utile de l’IA ?

Source : Wired