Stocker nos données sur ADN : une révolution est-elle en marche ?

Face au déluge de données qui menace de submerger nos capacités de stockage actuelles, la science explore une voie fascinante et quelque peu inattendue : l’utilisation de l’ADN comme support d’archivage. Si cette idée digne d’un roman de science-fiction paraît encore lointaine, elle recèle toutefois un potentiel immense pour répondre aux défis de demain. Dominique Lavenier (CNRS) en explicite les contours dans un opuscule richement illustré, paru aux éditions Apogée.

Le XXIe siècle se caractérise par une augmentation sans précédent de la production de données numériques. Chaque minute, des millions de messages sont échangés, des milliers d’heures de vidéo sont mises en ligne et des quantités astronomiques d’informations sont générées par les entreprises, les administrations et les particuliers. Cette croissance exponentielle, d’un facteur de multiplication de 1,3 à 1,4 par an, n’est pas sans écueil. Comment, en effet, stocker efficacement et durablement cette masse d’informations, dont certaines ne seront consultées qu’en de rares occasions et/ou au compte-goutte ?

Les technologies actuelles, basées sur des composants électroniques (SSD) ou des supports magnétiques (disques durs, bandes LTO), montrent des signes d’essoufflement. Les data centers, ces immenses infrastructures qui abritent des batteries de serveurs, consomment des quantités colossales d’énergie et nécessitent des renouvellements réguliers de matériel. Face à ces limites, le stockage de données sur ADN est de plus en plus étudié et pourrait constituer, à terme, une solution pérenne. 

Directeur de recherche au CNRS, Dominique Lavenier rappelle que l’idée d’utiliser l’ADN pour stocker des données n’est pas nouvelle, bien qu’elle connaisse un regain d’intérêt grâce aux progrès des biotechnologies et à l’urgence de trouver des alternatives aux supports de stockage traditionnels. Support de l’information génétique du vivant, l’ADN possède des caractéristiques qui en font un candidat idéal pour l’archivage de données. « Dans 1 g d’ADN, on peut théoriquement stocker l’équivalent de plusieurs milliers de disques durs. » Cette compacité extrême est due à la taille infime des nucléotides (A, C, G, T) qui composent l’ADN et à sa structure tridimensionnelle. 

Mieux : « Encapsulé, mis à l’abri des éléments extérieurs, et maintenu à température ambiante, l’ADN peut se conserver des centaines, voire des milliers, d’années sans se détériorer. » Cette durabilité, bien supérieure à celle des supports électroniques ou magnétiques, permet d’envisager un archivage à très long terme sans perte d’information. Des études ont même permis de décrypter l’ADN de mammouths vieux de plus d’un million d’années.

L’ADN est une molécule universelle, présente dans toutes les cellules vivantes. Les techniques de lecture de l’ADN (séquençage) ne cessent de progresser, grâce notamment aux avancées de la médecine personnalisée. Contrairement aux supports numériques obsolètes après quelques années, l’ADN restera lisible dans le futur, à condition de conserver ce que l’auteur qualifie de « notices », les éléments permettant d’interpréter les séquences.

Ces nombreux atouts font de l’ADN une solution a priori adaptée à l’archivage des données froides, ces informations rarement consultées mais qui doivent être conservées pour des raisons légales, historiques ou scientifiques. En stockant ces données sur ADN, on pourrait réduire considérablement la consommation énergétique des data centers et limiter le renouvellement incessant du matériel que les systèmes actuels impliquent. 

Comment stocker et lire des données sur ADN ?

Avec pédagogie, Dominique Lavenier revient sur le processus de stockage de données sur ADN. Ce dernier se déroule en plusieurs étapes. Le codage tout d’abord : l’information numérique (texte, image, vidéo…) est convertie en une séquence de caractères A, C, G et T, selon un code de correspondance spécifique. Ce codage doit tenir compte des contraintes de la synthèse et du séquençage, en assurant un équilibre entre les nucléotides et en évitant les répétitions. Ensuite, des machines spécialisées fabriquent des molécules d’ADN synthétique correspondant à la séquence codée. Cette étape cruciale est réalisée soit par chimie, soit par synthèse enzymatique. Les techniques actuelles permettent de produire des oligonucléotides (courtes chaînes d’ADN) d’environ 300 nucléotides.

Pour le stockage, les molécules d’ADN synthétique sont encapsulées dans des microcapsules étanches pour les protéger de l’environnement extérieur. Ces capsules peuvent être conservées à température ambiante pendant des centaines, voire des milliers d’années. Retrouver un document particulier nécessitera alors de sélectionner les molécules d’ADN qui lui sont associées parmi des millions d’autres. Cette sélection peut se faire, nous apprend l’auteur, par des techniques d’hybridation avec des billes magnétiques ou par PCR (réaction en chaîne par polymérase). Les molécules d’ADN sélectionnées sont lues par des séquenceurs, des machines capables de déterminer l’ordre des nucléotides. 

S’ensuit le décodage. La séquence de nucléotides obtenue est convertie en information numérique, grâce au code de correspondance initial. Des algorithmes de correction d’erreurs sont utilisés pour compenser les erreurs de séquençage ou les pertes de molécules. La solution apparaît d’autant plus prometteuse qu’elle s’inscrit dans un contexte hautement favorable. Ainsi, à ce stade, il convient de préciser que les technologies de séquençage ont connu une véritable révolution ces dernières années, avec une réduction drastique des coûts et des temps de lecture.

Pierres d’achoppement

De prime abord, on pourrait croire que Stocker nos données sur ADN supporte une forme de techno-béatitude. Mais Dominique Lavenier expose clairement les limites d’une telle biotechnologie. La fabrication des molécules d’ADN synthétique est aujourd’hui encore trop lente, coûteuse et polluante. « En 2025, la synthèse de molécules d’ADN est une opération excessivement lente si on la compare aux technologies numériques. » Des pistes d’amélioration sont explorées, comme la miniaturisation des processus, l’assemblage de petites molécules ou la synthèse enzymatique. Par ailleurs, bien que les technologies de séquençage aient fait des progrès considérables, elles restent imparfaites et destructives. C’est une opération aléatoire qui ne garantit pas la lecture de toutes les molécules. La conversion de l’information numérique en séquences d’ADN doit également tenir compte des contraintes biologiques et des risques d’erreurs. Des codes correcteurs d’erreurs complexes doivent être utilisés pour assurer la fiabilité du stockage.

Face à ces défis, d’autres alternatives au stockage sur ADN sont explorées. Le silicium en 3D, une technique qui consiste à empiler plusieurs couches de mémoire flash sur une puce de silicium, augmentant ainsi la densité de stockage. Les bandes magnétiques, qui, malgré leur âge, restent une solution viable pour l’archivage de masse, avec une capacité qui double tous les deux à trois ans. Mais l’alternative la plus intéressante demeure peut-être le verre. Des chercheurs ont élaboré une technique de gravure d’informations dans du verre avec un laser dit « femtoseconde ». Cette méthode offre une longévité potentielle de milliards d’années, ce qui intéresse de près des entreprises comme Microsoft. « Les chercheurs de l’université de Southampton, en Angleterre, qui ont mis au point cette technique, indiquent qu’une plaquette de verre de 120 × 120 mm d’une épaisseur de 2 mm aurait la capacité d’emmagasiner 360 téraoctets. » Enfin, le plastique : des polymères synthétiques pourraient être utilisés pour stocker des informations à l’échelle moléculaire, offrant ainsi une densité de stockage encore plus importante que l’ADN.

L’ADN : un avenir prometteur pour l’archivage de données ?

Le stockage sur ADN est une voie de recherche privilégiée pour répondre aux défis du stockage de données à long terme. Bien que des obstacles importants restent à surmonter, les avancées technologiques laissent entrevoir un avenir, peut-être pas si lointain, où ces molécules joueront un rôle-clé dans la préservation de notre patrimoine numérique.

« Il est clair que le remplacement du disque dur (ou de son équivalent électronique) par un boîtier de même taille basé sur la synthèse et la lecture de molécules d’ADN n’est pas pour demain », rappelle toutefois Dominique Lavenier. Car le stockage sur ADN se destine plutôt à l’archivage de données froides, comme nous l’avons vu, en complément des technologies déjà existantes. Dans ce domaine, ses atouts en termes de densité, de longévité et de faible consommation énergétique en font une solution particulièrement attractive.

Alors, l’ADN deviendra-t-il le nouveau Graal du stockage de données ? Seul l’avenir nous le dira. Mais une chose est sûre : cette révolution numérique est en marche, et elle pourrait bien transformer notre rapport à l’information et à la mémoire.

Fiche produit Amazon

J.F.


Stocker nos données sur ADN, Dominique Lavenier – Apogée, mars 2025, 72 pages


Posted

in

by

Comments

Laisser un commentaire