Experiment proběhl na Evropském institutu bioinformatiky (EBI), což je pracoviště Evropské laboratoře molekulární biologie (EMBL). Vědci jako vzorek dat zvolili sbírku Shakespearových sonetů, fotografii svého pracoviště, článek Jamese Watsona a Francise Cricka v časopise Nature (v němž roku 1953 poprvé popsali molekulární strukturu DNA) ve formátu PDF; k tomu také soubor popisující kódování dat a záznam projevu I Have a Dream Martina Luthera Kinga ve formátu MP3.
Efektivita ukládání dat do DNA je teoreticky obrovská: do jediného gramu by se prý dalo zakódovat 2,2 PB (petabajtů) dat. Zároveň by měl být záznam poměrně robustní a ani životnost by neměla být špatná (jak ukazují například úspěchy při čtení DNA dávno vyhynulých živočichů, či našich tisíce let mrtvých předků). Při experimentu byly ovšem také použity techniky pro ochranu a opravu dat pomocí redundance.
Při zápise a čtení DNA současnými metodami často dochází k chybám, zejména pokud se opakují stejná „písmena“ (ta jsou čtyři – nukleové báze adenin, cytosin, guanin a thymin). Data se proto kódují do formy, v níž k opakování písmen nedochází. Zároveň jsou rozptýlená do fragmentů, jejichž pořadí pro rekonstrukci určuje index (tedy cosi jako tabulka FAT či MFT), zároveň je záznam uložen v obou stranách dvojité šroubovice.
Syntetickou DNA z připravené digitální podoby vyrobila firma Agilent Technologies, správnost (a zároveň s tím i způsob čtení dat) pak ověřili vědci opět v institutu EBI. Experiment skončil velmi zdárně, neboť data se podařilo přečíst bez problémů. A výzkumníci chtějí v programu pokračovat. V další fázi by měli vylepšit kódování informace a zejména se začít potýkat s (jistě početnými) problémy, které brání praktickému nasazení.
Je ale otázka, zda může být tato teoretická kapacita v praxi vůbec využita. V prvé řadě je zde otázka ceny, která je prostě řečeno šílená. Současnými laboratorními metodami činí náklady zhruba 12 400 USD za 1 MB. Zlepšení v tomto ohledu jsou pochopitelně velmi pravděpodobná, je však otázka, zda se budou někdy stačit, aby se náklady dostaly na realistickou hodnotu.
Druhým problémem je rychlost přístupu, čtení a zápisu. V rámci vědeckého experimentu není čas příliš důležitý, pro reálné použití je však kritický, a to tím více, čím větší kapacita je použita. Mít k dispozici petabajty prostoru totiž není až tak užitečné, pokud se k uloženým datům nemůžeme dost rychle (tedy než umřete, když to trochu přeženu) dostat. Pro ilustraci si představte, že máte na internetu uložen filmový archiv, ale můžete se k němu připojit jen 56Kb modemem. Trochu se obávám, že DNA jako datové úložiště by mohla skončit podobnou situací.