Le CNRS lance son programme de recherche exploratoire dédié au stockage des données sur l’ADN

L’organisme public dédié à la recherche a lancé le 30 mai son PEPR dédié au stockage des données sur des supports ADN et polymères non ADN. Un procédé prometteur pour le stockage à faible coût de données « froides » mais dont les chercheurs espèrent pouvoir lever des derniers verrous technologiques pour permettre sa généralisation.

 

Réservé aux abonnés
Imagene
Les capsules de la startup bordelaise Imagene conservent l'ADN - et les informations stockées - à température ambiante.

Pourra-ton prochainement stocker le contenu d’un datacenter dans une capsule à peine plus petite qu’une pile classique ? C’est en tout cas le souhait du CNRS qui a lancé le 30 mai un programme et équipement prioritaire de recherche (PEPR) visant à explorer les technologies de stockage de données sous forme d’ADN.

« Avec le développement du numérique, notre besoin de stockage des données est devenu exponentiel, explique Marc Antonini, directeur de recherche CNRS et coordinateur de ce PEPR baptisé MoleculArXiv. La quantité de données stockées sur la planète devrait atteindre 175 trilliards d’octets d’ici à 2025. Nous devons trouver un moyen de stockage peu énergivore pour remplacer les centres de données, et plus durable : les bandes magnétiques ont une durée de vie comprise entre 5 et 10 ans. Il faut prévoir le transfert des données sur de nouveaux supports. »

Des centaines de petaoctets sur un gramme d’ADN

Le stockage sur ADN répond à ce besoin. Pour cela, un signal numérique binaire doit être converti en quaternaire afin de correspondre aux séquences d’un brin d’ADN, formées des quatre nucléotides ATCG. Un procédé de synthèse de l’ADN – comme le procédé enzymatique mis au point par la start-up française DNA Script – permet de produire des brins sur mesure en respectant ces séquences. L’ADN produit est ensuite stocké dans des capsules hermétiques spéciales, mises au point par la jeune pousse bordelaise Imagene. « Ce procédé permet théoriquement de stocker des centaines de pétaoctets sur un gramme d’ADN, à température ambiante et sans besoins énergétiques », commente Marc Antonini.

Si ce procédé semble prometteur pour stocker des données « froides » - c’est-à-dire des informations que l’on n’a pas besoin de consulter régulièrement -, il reste des verrous technologiques que les chercheurs doivent lever pour le fiabiliser. Le PEPR MoleculArXiv est un projet ambitieux qui va se pencher sur de nombreux aspects de cette technologie pour en améliorer l’efficacité, en réduire le coût et également en faciliter l’accès pour traiter des données plus « chaudes ».

Un projet pluridisciplinaire

Doté d’un budget de 20 millions d’euros sur 7 ans, il associera près de 20 laboratoires aux champs de compétences variés, dont 6 labos phares : le laboratoire Charles Sadron (chimie des polymères), le laboratoire Gulliver de l’ESPCI (chimie), le LIMMS (microfluidique), l’IPMC (Pharmacologie moléculaire), l’Irisa (bioinformatique) et l’I3S (traitement du signal). Ces organismes porteront 4 projets ciblés autour des matériaux, les techniques de séquençage, la mise en œuvre et enfin le passage à l’échelle.

Dans ce cadre, d’autres matériaux que l’ADN de synthèse, comme des polymères de types polyesters ou polyuréthane seront explorés avec pour objectif de réduire les coûts de stockage. L’accroissement des longueurs des chaînes de monomères fait également partie des voies d’amélioration identifiées par les chercheurs. « Une des pistes de recherche sur laquelle nous travaillons est ce que nous appelons l’accès aléatoire à la données. Lorsque vous avez une capsule contenant des millions de brins d’ADN, il faut pouvoir isoler efficacement l’information que l’on veut extraire, sans pour autant séquencer tous les brins, explique Marc Antonini. Dans ce cas, il faut pouvoir intégrer de la métadonnée au niveau de la molécule que l’on pourrait révéler chimiquement, afin de pouvoir séquencer uniquement les brins pertinents. »

Dans le cadre de MoleculArXiv, le CNRS s’est entouré de partenaires spécialisés dans la conservation de patrimoine comme l’institut national de l’audiovisuel (INA), la Bibliothèque national de France (BnF) ou encore la bibliothèque universelle de codes sources de logiciels, Software Heritage.

Newsletter La Quotidienne
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.