Image illustrant le concept de stockage de données sur ADN.

Analyse données

Comment fonctionne le stockage de données sur adn et quelles limites

30 avril 2026
Lionel Gigot

Sommaire

Le stockage adn, de quoi parle-t-on exactement ?

Le stockage ADN désigne une méthode qui consiste à convertir des données numériques en séquences d’ADN synthétique, puis à conserver ces informations sous forme de matière plutôt que sur un support électronique. Dit autrement, vos data, vos fichiers et votre information ne restent plus dans un disque, mais dans une molécule conçue pour stocker. Le sujet attire la recherche depuis des années, car l’ADN est déjà un système naturel de mémoire biologique, et il peut aussi servir à stocker des données sur le très long terme.

Le principe du stockage des données dans l’adn

Le point de départ reste simple. Un ordinateur manipule du binaire, donc des 0 et des 1. L’ADN, lui, repose sur quatre lettres, A, T, C et G. Il faut donc créer un code qui transforme une suite binaire en séquence exploitable. Chaque base ne correspond pas toujours directement à deux bits, car certaines répétitions rendent la synthèse et la lecture plus fragiles. Les chercheurs utilisent alors des règles de codage, de redondance et de correction d’erreurs pour encoder proprement les informations dans des brins ADN.

L’ADN synthétique utilisé ici n’a rien à voir avec du stockage in vivo. On ne parle pas d’insérer des données dans des cellules pour archiver nos documents. On parle d’un support moléculaire hors du vivant, produit en laboratoire, puis conservé dans des capsules ou sur un autre format stable.

Pourquoi cette technologie attire la data et l’informatique

Le stockage des données classique a un défaut bien connu. Les bandes, les SSD et les disques durs vieillissent, consomment de l’énergie, et demandent des migrations régulières. Pour de l’archivage, c’est lourd. L’ADN est une autre piste, parce qu’une fois les brins ADN écrits et correctement stockés, les données dans le support n’ont plus besoin d’alimentation continue.

Ce qui intéresse la data, ce n’est pas la vitesse. Franchement, sur ce point, l’ADN est encore loin derrière les systèmes informatiques actuels. Ce qui compte, c’est autre chose :

une densité physique extrême
une durée de conservation très longue
un besoin énergétique très faible hors lecture
une place minuscule pour archiver
une compatibilité future avec des usages d’archives

Le procédé paraît presque abstrait au début. En réalité, il suit une chaîne assez nette, avec plusieurs opérations successives. Chaque étape compte, car une erreur de code ou de chimie peut rendre la récupération impossible.

Du fichier binaire aux séquences d’adn synthétique

On part d’un fichier, texte, image, photo, vidéo ou base de données. Le contenu est traduit en bits, puis un algorithme va coder ces bits en lettres A, T, C et G. Cette méthode évite les motifs trop répétitifs, ajoute des index, et prépare le décodage futur. Pour stocker des données sur ce type de molécule, il faut aussi prévoir l’adressage. Sans lui, lire un fichier précis au milieu de millions de fragments devient un casse-tête.

La capacité de stockage de l'ADN théorique atteint environ 215 petabytes par gramme. D’autres estimations donnent 200 ou davantage selon le code retenu, mais l’ordre de grandeur reste le même. Un gramme d'ADN pourrait donc contenir des volumes qu’aucun centre classique ne met dans un si petit espace.

La synthèse d'adn, vrai goulot d’étranglement

Une fois la séquence calculée, il faut la fabriquer. C’est la phase de synthèse. Actuellement, la synthèse chimique de l'ADN domine encore, avec des fragments souvent limités à environ 150 à 200 bases. Des approches enzymatiques existent aussi. DNA Script, Twist Bioscience, Catalog, Evonetix et d’autres entreprises travaillent sur ce point depuis 2010 ou 2020 selon les cas.

Le problème, c’est le coût du stockage ADN, qui dépend surtout de cette écriture. Selon les ordres de grandeur publiés ces dernières années, on parle encore de centaines à des milliers de dollars par mégaoctet en environnement de recherche, parfois davantage selon le procédé, la qualité et le volume. Le prix de lecture baisse plus vite que celui de synthèse, mais l’écart reste énorme avec le storage classique.

Comment lire et décoder les brins adn

Pour récupérer les données sur ce support, il faut séquencer les brins. Le séquençage Illumina reste très utilisé pour lire avec précision, tandis que les nanopores ouvrent une autre voie, plus directe, mais parfois moins robuste selon le cas. Après lecture, un logiciel reconstruit la suite originale et corrige les erreurs.

Le processus complet tient en cinq blocs :

coder le fichier source
synthétiser les brins ADN
conserver les molécules hors eau et lumière
séquencer pour lire les séquences
décoder afin de reconstruire les informations

Capacité de stockage adn, durée de conservation adn et chiffres à retenir

Les promesses sont souvent énormes. Mieux vaut garder les chiffres solides et laisser de côté les slogans. Là où l’ADN impressionne vraiment, c’est sur la densité et la vie potentielle du support.

Quelle est la capacité de stockage adn réelle et théorique ?

La capacité de stockage ADN la plus citée tourne autour de 215 petabytes par gramme. En version plus parlante, cela revient à plusieurs millions de gigaoctets dans une quantité de matière minuscule. Certains parlent de 450 millions de To par gramme d'ADN selon des hypothèses plus larges. Le terme important ici, c’est théorique. Dans un système réel, vous perdez de la place avec les index, la redondance, les séquences de contrôle et les marges de sécurité.

Une démonstration connue date de juin 2019. Des chercheurs ont encodé 16 Go de la version anglaise de Wikipédia dans de l’ADN de synthèse. Ce test a surtout montré qu’il était possible de faire du stockage de données à une échelle déjà sérieuse, pas seulement quelques ko de démonstration.

La durée de conservation adn est-elle vraiment exceptionnelle ?

Oui, mais sous conditions. La durée de conservation de l'ADN peut dépasser 100 000 ans en conditions optimales, avec une protection contre l’eau, l’oxygène, la chaleur et la lumière. Certaines approches avec silice ou capsules métalliques avancent 50 000 ans, parfois plus. Il ne faut pas confondre cela avec une garantie produit. L’ADN est stable sur le long terme si le milieu est contrôlé.

Concrètement, pour conserver ce type de support, les équipes cherchent un environnement sec, sombre, à température modérée, parfois dans des capsules en métal. C’est là que le stockage sur ADN devient crédible pour les archives, bien plus que pour un usage quotidien.

Ce que ces chiffres changent pour nos archives de données

Si 60 % à 80 % de nos données sont froides, comme le rappellent plusieurs travaux de recherche, alors une partie du problème n’est pas l’accès rapide, mais l’archivage. Dans ce contexte, le stockage des archives longues et le stockage sur capsule deviennent plus pertinents que le remplacement des SSD.

Trois chiffres résument assez bien le sujet :

215 petabytes par gramme
plus de 100 000 ans en conditions idéales
16 Go encodés en 2019 sur ADN synthétique
des fragments de 200 bases en synthèse courante
des coûts encore en dollars par mégaoctet, trop hauts pour une grande échelle

Coût du stockage adn, limites techniques et entreprises à suivre

Côté portefeuille, c’est net. L’ADN n’est pas une solution grand public actuellement. Le frein principal reste industriel, pas théorique.

Pourquoi le coût du stockage adn reste très élevé

Le coût du stockage ADN vient de deux postes. D’abord l’écriture, avec des réactifs chimiques, des machines, des contrôles qualité et beaucoup de temps. Ensuite la lecture, qui exige un séquençage fiable et un traitement bioinformatique. Selon les publications et les démonstrateurs, la synthèse peut encore coûter de 100 à 1 000 dollars par mégaoctet, parfois plus en faible volume. La lecture coûte moins, mais elle n’est pas négligeable.

Le point qui coince, c’est l’échelle. Pour faire du stockage des données dans un data center, il faut produire vite, à bas coût, avec une méthode stable. Nous n’y sommes pas encore. La technologie est prometteuse, mais la réalité industrielle impose une vraie prudence.

Les limites pratiques du stockage sur adn pour les données

Il existe plusieurs blocages techniques. La vitesse d’écriture reste lente. La récupération aléatoire d’un fichier précis n’est pas encore aussi simple qu’avec un disque dur. Le taux d’erreur impose du code correcteur. Et la miniaturisation du système complet, du codage à la lecture, demande encore du travail.

Il faut aussi éviter une confusion fréquente. Le stockage ADN n’est pas pensé pour remplacer toutes les solutions. Il vise surtout les données sur archives, les sauvegardes patrimoniales, certains objets numériques rares, ou des corpus scientifiques à conserver très longtemps.

Quelles entreprises et quels chercheurs avancent sur le sujet

La France a pris une place visible sur ce terrain. Le CNRS, via le projet MoleculArXiv, soutient une partie de la recherche. Biomemory, Pearcode, DNA Script ou Imagene reviennent souvent dans les échanges. Côté international, Microsoft a participé à la DNA Data Storage Alliance avec Western Digital et Twist. Marc Antonini, directeur recherche au CNRS et chercheur associé à ce champ, explique depuis plusieurs années que la bataille se joue sur la synthèse ADN, le décodage et l’accès ciblé aux brins.

Parmi les acteurs à suivre, vous retrouvez souvent :

Biomemory en France
Pearcode côté algorithmes
Twist Bioscience pour la synthèse
DNA Script sur l’approche enzymatique
Microsoft via la DNA Data Storage Alliance

Questions fréquentes sur le stockage adn

Le sujet soulève toujours les mêmes questions, et c’est assez logique. Entre science, informatique et industrie, les frontières ne sont pas toujours claires.

Le stockage de l’adn est-il possible actuellement ?

Oui, c’est déjà possible en laboratoire et dans quelques démonstrateurs industriels. Des fichiers, des films, des textes et des archives ont déjà été encodés puis relus. En revanche, la disponibilité à grande échelle reste limitée.

Pourquoi ne pas utiliser l’adn pour toutes les données ?

Parce que la vitesse et les coûts ne suivent pas encore. Pour des accès fréquents, les disques durs, SSD et autres supports restent bien plus adaptés. L’ADN vise surtout le long terme et les données rarement lues.

Dans quelles conditions faut-il conserver l’adn ?

Il faut le garder à l’abri de l’eau, de l’oxygène, de la lumière et des variations thermiques. Des capsules, de la silice ou un conditionnement sec améliorent fortement la stabilité. La durée de vie dépend directement de ces conditions.

Quelles perspectives pour les prochaines années ?

Le mouvement ira sans doute vers une baisse des coûts, une meilleure automatisation et des systèmes hybrides. Le stockage sur ADN pour l’archivage institutionnel, scientifique ou patrimonial paraît crédible avant un usage large. Mais autant le dire, entre la preuve de concept et une infrastructure standard, il reste encore pas mal de chemin.