ADN

Données stockées sur ADN : on avance, mais moins vite que la production de datas

© Google Deepmind

Face à la gourmandise énergétique des data centers, les scientifiques se penchent depuis plusieurs années sur la piste d'un stockage sur l’ADN. Mais c'est loin d'être gagné.

« 50 millions de messages échangés chaque minute sur WhatsApp, 30 000 nouvelles heures de vidéo publiées toutes les heures sur YouTube et entre 23 et 27 milliards de SMS envoyés chaque jour dans le monde. » Le constat dressé par le scientifique Dominique Lavenier est impressionnant : « La production [de données numériques] double tous les trois ans. Dans trente ans, à ce rythme, le volume annuel sera mille fois plus important ! » Dans son ouvrage Stocker nos données sur ADN paru en avril 2025 aux éditions Apogée, le bio-informaticien et directeur de recherche au CNRS questionne le stockage de ces données qui prennent de plus en plus de place dans les data centers. Ces « énormes bâtiments énergivores » seraient près de 7 000 en 2025 dans le monde et leur nombre ne cesse de croître.

Lointaines promesses

Pour éviter l’emprise trop importante des centres de stockage, les scientifiques du monde entier cherchent donc des supports moins énergivores et plus résistants à l’épreuve du temps. Prometteuse, la piste de l’ADN est explorée depuis plusieurs années : sa molécule peut être conservée pendant des milliers d’années et permet un stockage extrêmement dense. « Un gramme d’ADN peut stocker l’équivalent de plusieurs milliers de disques durs », illustre le chercheur.

La piste semble si prometteuse que depuis 2018 – d’après la base de données IEEE Xplore – le nombre de publications scientifiques contenant les expressions « DNA storage » ou « DNA data storage » est passé d’un peu plus de 20 à presque 180 en 2024. En moins d’une décennie, « il y a eu une prise de conscience qu’il faut trouver de nouveaux supports pour stocker l’information », augurant des technologies plus mûres et invitant les chercheurs et les industriels à davantage se pencher sur la question.

Cependant, le stockage sur ADN serait pour autant loin d’être suffisant pour l’ensemble des données numériques. Il ne serait utile que pour les données dites « froides » qu’on ne consulte que très rarement, comme les comptes d’entreprises, des données médicales ou notariales, ou encore des photos et vidéos qu’on ne regarde plus… « qui représentent 80 à 90 % des données stockées dans les data centers », estime Dominique Lavenier.

« Rupture technologique »

Pour le moment, le principal frein au développement de cette technologie est le processus d’écriture sur ADN. Au mieux, en 2019, Microsoft a réussi à automatiser toutes les étapes du chiffrage au déchiffrage, en « seulement » 21 h, pour enregistrer et relire le mot « hello ». En somme, « nous savons synthétiser de l’ADN, mais pas de façon rapide, économique ou non polluante », résume Dominique Lavenier. Face à cela, les chercheurs essaient principalement de miniaturiser les processus en combinant électronique et biochimie. Cela permettrait de produire plusieurs millions de brins d’ADN en même temps, réduisant ainsi les coûts tout en gardant des temps de synthèse similaires.

Dans cet exercice, les États-Unis ont une longueur d’avance. L’Europe rattrape cependant son retard, notamment avec le projet MoleculArXiv qui réunit une vingtaine d’équipes pluridisciplinaires travaillant quant à elles sur l’accélération de la synthèse de l’ADN. Si cela peut actuellement prendre quelques heures, l’objectif serait de le faire en quelques secondes. « La prochaine étape est de trouver d’autres chimies pour synthétiser l’ADN. Une rupture technologique est nécessaire », insiste le chercheur. Cette rupture serait à l’image de la lecture de l’ADN du génome humain à la fin des années 1990, dont le temps de décryptage estimé à 20 ans a coûté 3 milliards de dollars, contre quelques heures et quelques centaines d’euros aujourd’hui. En attendant ce bouleversement, Dominique Lavenier s’interroge. « La question fondamentale derrière tout ça est surtout de savoir si on a besoin de stocker toutes ces données », ou s’il ne faut pas plutôt miser sur une meilleure hygiène numérique.

Discutez en temps réel, anonymement et en privé, avec une autre personne inspirée par cet article.

Viens on en parle !
Podacast : En immersion
commentaires

Participer à la conversation

Laisser un commentaire