
Un déluge de datas ! Voilà ce qui pourrait engloutir tout progrès. Pourtant, des alternatives aux data centers traditionnels pourraient être créées.
Internet s’est développé avec un champ lexical laissant fantasmer son immatérialité. Nous « dématérialisons », créons des mondes « virtuels », stockons nos données dans le cloud. Mais tout cela est bien physique, et l’explosion de nos données sature des data centers en surchauffe. L’IA notamment, implique un stockage de datas astronomique. Face à ce constat, Martin Kunze, le créateur de Memory of Mankind (une archive des connaissances modernes à destination de nos descendants) s’est attelé – avec des entrepreneurs de la tech – à élaborer une alternative aux data centers traditionnels. Et si l’on gravait au laser nos données sur du verre recouvert de céramique ? Ainsi, est né Cerabyte, une solution de stockage écologique et économique.
Cerabyte est une solution pour le stockage des « cold datas ». Pourquoi leur gestion spécifique est-elle essentielle ?
Martin Kunze : Les cold datas représentent 70 % des datas stockées. Il s’agit d’un type de datas gardées sur des supports pendant de longues périodes et rarement récupérées. Par exemple, la photo d’un numéro qu’on prend dans un parking pour retrouver sa voiture et qu’on est ensuite trop paresseux pour effacer du cloud, ou de vieux documents qu’on garde « au cas où ». On retrouve cette paresse dans les entreprises, qui préfèrent souvent payer plus cher pour étendre leur cloud que d’effacer activement leurs datas. Pour des entreprises comme Amazon enfin, les cold datas sont la trace de tout ce que leurs clients regardent, achètent, des articles qu’ils retournent. Cela leur permet de dresser des profils d’utilisateurs. Mais on connait désormais un tournant avec l’IA. Une part considérable des cold datas concerne la façon dont les IA prennent les décisions. Et ces informations doivent être stockées pour des durées indéterminées.
Et en effet, Cruise, la société de véhicules autonomes de General Motors vient d’être condamnée à une amende d’1,5 million de dollars pour n’avoir pas été en mesure de livrer les datas d’un accident causé par l’une de ses voitures...
M. K. : Oui, car lorsqu’un accident mettant en cause une intelligence artificielle se produit, alors l’entreprise qui a utilisé l’IA doit fournir au tribunal les détails de la façon dont le système a pris la décision. Ces datas permettent de déterminer si un accident pourrait se produire à nouveau, de déterminer s’il s’agissait d’un mauvais paramétrage. Par conséquent, les IA impliquent une quantité énorme de cold datas.
Microsoft a annoncé un investissement de 80 milliards de dollars dans des data centers dédiés à l’IA en 2025. Certains s’alarment du coût environnemental et énergétique colossal que cela impliquera. La firme travaille pourtant depuis des années à l’élaboration d’une technique de stockage sur verre, Silica Project. Mais le changement de modèle semble long à venir…
M. K. : Microsoft n’investit pas dans la conservation longue durée de datas. Silica est une part infime de leurs activités. Je pense que la plupart des employés ou dirigeants ne sont même pas au courant de son existence. Et le projet pose un problème physique. Le verre est trop fragile pour endurer un gravage rapide des données. Il ne permet donc pas un usage à large échelle. Silica est une vitrine, un enjeu d’image. Microsoft nie l’évidence des limites de notre capacité à absorber les données dans des data centers classiques. Des analystes commencent à pointer cette question brûlante, mais la prise de conscience tarde à venir. Nous cherchons à sensibiliser sur cette question. L’IA n’est rien sans la data, et par conséquent, sans solution viable de stockage, elle est vouée à mourir sous son propre poids.
Cerabyte a intégré l’Open Lab du CERN (Centre Européen de Recherche Nucléaire) pour une raison similaire : leur besoin astronomique de datas. En quoi consiste votre « collaboration » ?
M. K. : Le CERN travaille à une nouvelle génération d’accélérateur de particules, qui va générer encore plus de datas que le volume qu’ils gèrent actuellement. Ils stockent aujourd’hui leurs données sur des bandes magnétiques, solution la plus économique, mais ils ont conscience que le coût du stockage de données, qu’ils souhaitent pour une durée indéterminée, serait si élevé qu’ils doivent trouver d’autres alternatives technologiques. Notre collaboration est intéressante, car ils ne veulent pas seulement acheter notre dispositif, ils veulent le développer avec nous. Et il ne s’agit pas uniquement de stocker des données sur du verre recouvert de céramique, mais aussi de les rendre lisibles par des outils accessibles, afin qu’elles soient récupérables dans 100 ans, même si Cerabyte n’existe plus. C’est quelque chose de novateur, car l’industrie du stockage de données n’envisage pas du tout ces délais. Cerabyte, oui. Nous avons une approche de la permanence. Et avec le CERN, nous travaillons à un manuel, une sorte de mode d’emploi, qui permettra à des scientifiques de lire ces données avec un simple microscope à balayage laser, sans le concours de notre dispositif. Notre démarche est imprégnée de la philosophie open source.
Et les entreprises gardent ainsi la main sur leurs datas, elles ne sont plus confiées au cloud, autrement dit à des data centers externes…
M. K. : Aujourd’hui, les entreprises ont déjà cette possibilité, mais cela implique d’avoir des centaines de disques durs dans des locaux techniques, avec une maintenance onéreuse et la nécessité de remplacer le matériel tous les 5 ans. C’est pourquoi la plupart choisissent de conserver leurs données dans le cloud. Cerabyte permet de conserver ces données sans électricité, sur un support pérenne, résistant aux températures glaciales ou brûlantes, et sans connaître les problèmes de maintenance, donc de façon beaucoup plus économique. Même les premiers équipements disponibles, qui seront plus chers que ceux des générations suivantes, seront amortis en 25 ans. Et ils concernent des datas qui nécessitent d’être stockées pendant un siècle ou plus.
À quel stade de développement en est Cerabyte ?
M. K. : Nous avons un prototype fonctionnel. Et nous serons en mesure d’offrir un stockage d’un petaoctet (soit 1000 teraoctet, ndlr). C’est un volume de stockage adapté à des archives nationales, à des universités ou à l’industrie cinématographique. Mais ça n’est pas assez pour Google ou le site d’Amazon.
Participer à la conversation