[L'instant tech] Le stockage des données dans l’ADN, une piste prometteuse

Les OGM dans les labos – Episode 1/4. Alors que dans les champs, la place des organismes génétiquement modifiés (OGM) fait débat, les modifications du génome s'épanouissent en laboratoire et visent d’autres applications. Grâce à sa densité, longévité et autonomie énergétique, l’ADN de synthèse pourrait par exemple servir au stockage des données. Une technologie dont la maturité avance à grands pas, notamment grâce à des acteurs tricolores.

Réservé aux abonnés
DNA Script
DNA Script a remplacé les méthodes chimiques par l’utilisation d’enzymes modifiées pour produire de l’ADN à façon.

Toutes les données notariales de France stockées à l’intérieur d’une petite capsule, rangée dans le fond d’un tiroir de bureau. L’image a de quoi surprendre, mais aussi séduire à l’heure où les méthodes électroniques et magnétiques de stockage montrent leur faiblesse.

« Un millionième des terres émergées est aujourd’hui utilisé pour le stockage de données, qui capte 2 à 4 % de l’électricité dans les pays développés, alerte François Képès, chercheur en biologie cellulaire et coauteur d’un rapport sur le stockage de données dans l’ADN pour l’Académie des technologies, dont il est membre. Si toutes nos données étaient stockées dans de l’ADN, elles tiendraient dans le coffre d’une fourgonnette. » 

Dans son rapport, l’Académie rend son verdict : trop consommatrices en terrain, en ressources rares et en énergie, les techniques actuelles ne seront plus pérennes passé 2040. En miroir, l’alternative de l’ADN comporte de multiples atouts : la molécule se conserve pendant 52 000 ans à température ambiante, sans consommer d’énergie, avec une densité informationnelle dix millions de fois supérieure à celle d’un serveur. Évoqué pour la première fois en 1959 par le physicien américain Richard Feynman, le stockage dans l’ADN relève d’un concept plutôt simple : si les données peuvent être numériquement encodées sous forme de 0 et 1, elles peuvent aussi l’être sous la forme de ATCG, soit les quatre nucléotides – adénine, thymine, cytosine, guanine – qui forment l’ADN de tout être vivant.

Coder, écrire, stocker, lire et décoder

Les limites du stockage dans l’ADN sont la vitesse et le coût de la lecture, et plus encore de l’écriture.

—  François Képès, chercheur en biologie cellulaire

Dans la pratique, cela se traduit par cinq étapes, plus ou moins complexes : coder, écrire, stocker, lire et décoder. « Coder et décoder sont deux étapes informatiques servant à transformer les nucléotides ATCG en 0 et 1, explique François Képès. Écrire et lire renvoient, elles, à deux opérations chimiques : la synthèse de l’ADN et son séquençage. » C’est là que résident les principaux verrous à lever pour remplacer les entrepôts de serveurs par des armoires à capsules d’ADN. « Les limites du stockage dans l’ADN sont la vitesse et le coût de la lecture, et plus encore de l’écriture, observe le biologiste. Comparée au stockage électronique, la lecture de données encodées dans de l’ADN est 1 000 fois plus lente et plus chère ; l’écriture, 100 millions. »

Si elle reste aussi peu compétitive, la technologie du stockage ADN est donc à renvoyer au siècle prochain. Mais ce serait oublier sa vitesse de progression. « Depuis dix ans, les coûts de lecture et d’écriture de l’ADN chutent en moyenne de moitié tous les six mois, note François Képès. C’est bien plus que la loi de Moore, selon laquelle l’électronique gagne un facteur deux tous les deux ans. » Dans son rapport, l’Académie des technologies donne deux échéances : une lecture compétitive d’ici à 2025, une écriture dans dix à vingt ans. Son pronostic se fonde sur le pari qu’une nouvelle méthode de fabrication d’ADN – la synthèse enzymatique – gagne sa maturité industrielle.

Une fois n’est pas coutume, l’innovation est portée... par une pépite tricolore ! Installé au Kremlin-Bicêtre (Val-de-Marne) et à San Francisco (États-Unis), DNA Script a été fondé par trois anciens salariés de Total qui travaillaient sur la production de biocarburants grâce à la modification génétique de micro-organismes. « Là, nous avons compris que l’utilisation de l’ADN de synthèse en grande quantité allait exploser, explique Xavier Godron, cofondateur et directeur technique. Nous avons fondé DNA Script afin de développer une nouvelle technologie d’écriture d’un gène beaucoup plus rapide que les actuelles. » Alors que l’ADN de synthèse, fabriqué aujourd’hui par une poignée d’usines avec des solvants polluants, peut mettre plusieurs semaines à être livré, DNA Script est capable d’en créer en quelques heures avec… une imprimante. 

Les premières imprimantes à ADN

Pour ce faire, la start-up a troqué la chimie organique contre une méthode enzymatique. « Concrètement, on a recopié ce qui se passe dans les cellules, vulgarise Xavier Godron. La division cellulaire fait intervenir des enzymes polymérases, qui copient naturellement l’ADN. Nos recherches nous ont permis d’améliorer ces enzymes pour leur faire fabriquer de l’ADN à façon. » Un procédé plus écologique, plus rapide, à disposition directe des scientifiques et fabricant un ADN de bonne qualité. En 2018, DNA Script a été sélectionnée par la Iarpa, l’agence de recherche du renseignement américain, pour former avec le MIT, Harvard et Illumina, un consortium dont l’objectif est de réussir à faire de la synthèse d’ADN sur une puce semiconducteur. Leur financement : 26 millions de dollars, dont 6,5 millions pour DNA Script.

Si ses machines sont au stade de la précommercialisation, la technologie n’est pas encore mature pour le stockage de données. « Aujourd’hui, nous pouvons synthétiser un maximum de 384 séquences dans notre instrument, destiné pour l’instant au marché des sciences de la vie, reconnaît Xavier Godron. Pour être compétitif dans le stockage de données, il faudra être capable de synthétiser des centaines de millions de séquences ADN différentes en parallèle. »

Améliorer le codage des données

La synthèse de l’ADN doit donc encore franchir une barrière technologique pour ouvrir la voie au stockage de données. En parallèle, les autres étapes continuent de progresser. Le projet européen OligoArchive, par exemple, vise à améliorer le codage des données. « Aujourd’hui, l’encodage est généralement indirect : on convertit la donnée en langage informatique 0 et 1, puis on traduit ce langage en une séquence de nucléotides ATCG, expose Marc Antonini, directeur de recherche au CNRS, au sein du Laboratoire de signaux et systèmes de Sophia Antipolis (Alpes-Maritimes). Sauf que ce process a une limite : il ne permet pas de pouvoir contrôler la longueur de séquence de nucléotides, dont la dimension peut faire s’envoler le prix de fabrication. Nous travaillons donc sur l’encodage directement en quaternaire, pour contrôler le nombre de nucléotides qui sortent après le codage et donc pour contrôler le coût. » Pour ce faire, Marc Antonini et son équipe développent un algorithme pour trouver l’encodage optimum entre coût et qualité de compression.

Le français Imagene pour conserver l’ADN dans des pile-boutons hermétiques, la start-up britannique Oxford Nanopore Technologies pour sa lecture dans un petit appareil connectable par port USB, l’américain Illumina pour fabriquer les séquenceurs d’ADN... des leaders émergent à l’international pour constituer une nouvelle industrie. Elle s’adressera au stockage de données froides, comme celles archivées ou de sauvegarde, et non à celles vives ou souvent lues. Exemple : les 60 petaoctets de films conservés par l’Institut national de l’audiovisuel, les historiques bancaires gardés douze ans par les établissements, ou encore les 100 petaoctets de données expérimentales du Cern, à Genève (Suisse).

Ces marchés de niche pourraient être abordés dès 2025 ou 2030. Avant que ne soit attaqué tout le marché de l’archivage, si la compétitivité coût est au rendez-vous, estimé à plus de 5 milliards de dollars aujourd’hui et promis à une belle croissance.

Newsletter La Quotidienne
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.
Les webinars
Les services L'Usine Nouvelle
Détectez vos opportunités d’affaires
28 - 3F CENTRE VAL DE LOIRE
Date de réponse 11/05/2026
Trouvez des produits et des fournisseurs