Vědci úspěšně uložili data do molekuly DNA. Jeden gram prý stačí na 2,2 PB

28. 1. 2013

Sdílet

 Autor: Redakce

Že na pevných discích dochází volné místo, to je cosi jako základní životní jistota, jíž člověk nemůže uniknout. Asi nejsem sám, koho proto těší zprávy o průlomech na poli ukládání dat. Minulý týden přišla ze světa zpráva z tohoto soudku – vědcům se totiž podařilo k uložení dat experimentálně použít molekulu DNA. Do té matka příroda ukládá dědičnou informaci živých organismů; technologie okoukané z biologie jsou přitom často ty nejlepší. Pokud nám ale má tento pokus přinést větší a lepší disky, hned tak brzo to asi nebude.

Experiment proběhl na Evropském institutu bioinformatiky (EBI), což je pracoviště Evropské laboratoře molekulární biologie (EMBL). Vědci jako vzorek dat zvolili sbírku Shakespearových sonetů, fotografii svého pracoviště, článek Jamese Watsona a Francise Cricka v časopise Nature (v němž roku 1953 poprvé popsali molekulární strukturu DNA) ve formátu PDF; k tomu také soubor popisující kódování dat a záznam projevu I Have a Dream Martina Luthera Kinga ve formátu MP3.

Dr. Nick Goldman se syntetizovnou DNA

Efektivita ukládání dat do DNA je teoreticky obrovská: do jediného gramu by se prý dalo zakódovat 2,2 PB (petabajtů) dat. Zároveň by měl být záznam poměrně robustní a ani životnost by neměla být špatná (jak ukazují například úspěchy při čtení DNA dávno vyhynulých živočichů, či našich tisíce let mrtvých předků). Při experimentu byly ovšem také použity techniky pro ochranu a opravu dat pomocí redundance.

Při zápise a čtení DNA současnými metodami často dochází k chybám, zejména pokud se opakují stejná „písmena“ (ta jsou čtyři – nukleové báze adenin, cytosin, guanin a thymin). Data se proto kódují do formy, v níž k opakování písmen nedochází. Zároveň jsou rozptýlená do fragmentů, jejichž pořadí pro rekonstrukci určuje index (tedy cosi jako tabulka FAT či MFT), zároveň je záznam uložen v obou stranách dvojité šroubovice.

Struktura dvojité šroubovice DNA

Syntetickou DNA z připravené digitální podoby vyrobila firma Agilent Technologies, správnost (a zároveň s tím i způsob čtení dat) pak ověřili vědci opět v institutu EBI. Experiment skončil velmi zdárně, neboť data se podařilo přečíst bez problémů. A výzkumníci chtějí v programu pokračovat. V další fázi by měli vylepšit kódování informace a zejména se začít potýkat s (jistě početnými) problémy, které brání praktickému nasazení.

 

Je ale otázka, zda může být tato teoretická kapacita v praxi vůbec využita. V prvé řadě je zde otázka ceny, která je prostě řečeno šílená. Současnými laboratorními metodami činí náklady zhruba 12 400 USD za 1 MB. Zlepšení v tomto ohledu jsou pochopitelně velmi pravděpodobná, je však otázka, zda se budou někdy stačit, aby se náklady dostaly na realistickou hodnotu.

Pevný disk

ICTS24

Druhým problémem je rychlost přístupu, čtení a zápisu. V rámci vědeckého experimentu není čas příliš důležitý, pro reálné použití je však kritický, a to tím více, čím větší kapacita je použita. Mít k dispozici petabajty prostoru totiž není až tak užitečné, pokud se k uloženým datům nemůžeme dost rychle (tedy než umřete, když to trochu přeženu) dostat. Pro ilustraci si představte, že máte na internetu uložen filmový archiv, ale můžete se k němu připojit jen 56Kb modemem. Trochu se obávám, že DNA jako datové úložiště by mohla skončit podobnou situací.

Zdroje: TechSpot, EMBL-EBI