ПРОЦЕСС ЗАПИСИ данных на препарат ДНК требует продолжительного времени, поэтому, по мнению ученых, такой носитель сейчас пригоден только для создания архивов данных Источник: Wikipedia |
Ученые из Института бионики Уисса Гарвардского университета применили технологию создания цепочек ДНК для записи 70 млрд копий не опубликованной пока книги. Статья об этом была опубликована недавно в журнале Science.
«Всю информацию, так или иначе накопленную в мире до сегодняшнего дня, можно записать на ДНК-носителе весом около 4 грамм», — заявил Шрирам Косури, старший исследователь института.
Ученые сформировали двоичный код, применяя ДНК-маркеры, и с его помощью записали текст книги Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves in DNA («Регенезис: синтетическая биология как способ заново открыть природу и нас самих через ДНК»). Книгу написал один из участников исследования, Джордж Черч, профессор генетики в Гарвардском медицинском колледже. Он участвовал в разработке первого прямого метода создания цепочек ДНК в 1984 году. Он также входил в число инициаторов Проекта генома человека; в то время он работал в компании Biogen.
«Мы хотели, чтобы тестовая информация имела актуальный вид, поэтому использовали версию текста книги в формате HTML, — отметил Черч. — HTML предполагает использование цифровых изображений и Java-скриптов. Полученный набор данных был закодирован в двоичном исчислении и записан с помощью ДНК».
Исследователи смогли записать 5,5 петабайт, что соответствует миллиону гигабит данных на кубическом миллиметре носителя — препарата ДНК. Процесс записи данных требует продолжительного времени, поэтому, по мнению ученых, такой носитель сейчас пригоден только для создания архивов данных.
«По плотности записи информации наш метод превосходит все другие экспериментальные методы хранения, основанные на тех или иных биологических и физических законах», — отметил Косури.
Ученые уже давно изучали ДНК как многообещающую потенциальную среду хранения данных, размеры элементов которой сравнимы с атомными, которая отличается стабильностью и имеет срок жизни, достигающий тысячи лет. В недавнем эксперименте ученым из Гарварда удалось повысить плотность хранения в 1000 раз по сравнению с показателями, достигавшимися в предшествовавших попытках. «Большинство методов хранения данных, в которых не используется ДНК, предполагают запись данных на плоский носитель, в то время как ДНК позволяет хранить информацию в объемной среде, лабораторном стакане. Плотность исключительно высока — один бит на нуклеиновое основание и одно нуклеиновое основание на кубический нанометр. Объем грамма ДНК не превышает кубического миллиметра, следовательно, достаточно одного грамма, чтобы записать около сикстибайта», — пояснил Черч.
В прошлом году два японских университета сообщили, что использовали искусственную ДНК для записи более 100 бит данных в цепочке генома.
Гарвардские исследователи использовали четыре нуклеиновых основания ДНК — аденин (A), цитозин (C), гуанин (G) и тимин (T) в качестве двоичных маркеров. Как пояснил Косури, здесь A и C принимаются за ноль, T и G — за единицу.
Если для поддержания стабильности некоторых экспериментальных носителей, например используемых в квантовой голографии, требуются сверхнизкие температуры, приближающиеся к абсолютному нулю ( – 273 °C), и огромные энергозатраты, то ДНК стабильна при комнатной температуре. «Такой носитель можно оставить где угодно — в пустыне или в вашем заднем дворе, и, найденный через 400 тыс. лет, он будет хранить информацию», — отметил Черч.
«Мы принципиально не пользовались живыми клетками, — подчеркнул Черч. — В живом организме информация составляет крошечный фрагмент целой клетки, то есть большая часть носителя пропадает зря. Но, что более важно, практически сразу же, как только ДНК попадает в клетку, если данная ДНК не имеет возможности обеспечивать свою жизнеспособность, начинается процесс мутации, и в конечном итоге она полностью уничтожается».
Группа отказалась и от так называемого «разбиения цепочек», предполагавшего разбор цепочек ДНК путем выявления наложений в коротких цепочках. Вместо этого ученые решили опираться на достижения информационных технологий и закодировали свою книгу 96-битными блоками. С изображениями книга в формате HTML потребовала 54 898 таких блоков, каждый из которых представлял собой уникальную цепочку ДНК.