РЕКЛАМА

ДНК як носій для зберігання величезних комп'ютерних даних: реальність дуже скоро?

Проривне дослідження робить значний крок вперед у пошуках розробки a ДНК-система зберігання цифрових даних.

Digital дані сьогодні зростає з експоненціальною швидкістю через нашу залежність від гаджетів і потребує надійного тривалого зберігання. Зберігання даних поступово стає складним, оскільки поточні цифрові технології не можуть забезпечити рішення. Наприклад, за останні два роки було створено більше цифрових даних, ніж за всю історію комп'ютери, насправді щодня у світі створюється 2.5 квінтильйона байт {1 квінтильйон байт = 2,500,000 2,500,000,000 XNUMX терабайт (ТБ) = XNUMX XNUMX XNUMX XNUMX гігабайт (ГБ)} даних. Це включає дані на сайтах соціальних мереж, онлайн-банківські операції, записи компаній і організацій, дані із супутників, спостереження, дослідження, розробки тощо. Ці дані величезні та неструктуровані. Таким чином, зараз постає серйозна проблема — вирішити величезні потреби в сховищі для даних і їх експоненційне зростання, особливо для організацій і корпорацій, яким потрібне надійне довгострокове зберігання.

На даний момент доступні варіанти: жорсткий диск, оптичні диски (CD), карти пам’яті, флеш-накопичувачі та більш просунуті стрічкові накопичувачі або оптичні диски BluRay, які зберігають приблизно до 10 терабайт (ТБ) даних. Такі запам'ятовуючі пристрої, хоча і використовуються зазвичай, мають багато недоліків. По-перше, вони мають низький або середній термін зберігання, і вони повинні зберігатися при ідеальних умовах температури та вологості, щоб вони могли прослужити багато десятиліть і, таким чином, вимагали спеціально розроблених фізичних місць для зберігання. Майже всі вони споживають багато енергії, громіздкі та непрактичні та можуть бути пошкоджені при простому падінні. Деякі з них дуже дорогі, часто стикаються з помилками даних і, отже, недостатньо надійні. Варіант, який був загальноприйнятий організацією, називається хмарними обчисленнями – домовленістю, за якою компанія в основному наймає «зовнішній» сервер для обробки всіх своїх вимог до ІТ та зберігання даних, який називають «хмарою». Одним з основних недоліків хмарних обчислень є проблеми з безпекою та конфіденційністю, а також вразливість до атак з боку хакерів. Існують також інші проблеми, такі як високі витрати, обмежений контроль з боку батьківської організації та залежність від платформи. Хмарні обчислення все ще вважаються хорошою альтернативою для довготривалого зберігання. Однак схоже, що цифрова інформація, яка генерується в усьому світі, безперечно перевершує нашу здатність зберігати її, і потрібні ще більш надійні рішення, щоб задовольнити цей потік даних, забезпечуючи масштабованість, щоб також враховувати майбутні потреби в сховищі.

Чи може ДНК допомогти у сховищі комп’ютера?

наш ДНК (Дезоксирибонуклеїнова кислота) розглядається як захоплююче альтернативне середовище для зберігання цифрових даних. ДНК це матеріал, що самовідтворюється, присутній майже в усіх живих організмах і становить нашу генетичну інформацію. Штучний або синтетичний ДНК це міцний матеріал, який можна виготовити за допомогою наявних у продажу машин для синтезу олігонуклеотидів. Основною перевагою ДНК є її довговічність ДНК служить у 1000 разів довше, ніж кремній (кремнієвий чіп – матеріал, який використовується для будівництва комп'ютери). Дивно, лише один кубічний міліметр ДНК може вмістити квінтильйон байтів даних! ДНК також є надкомпактним матеріалом, який ніколи не руйнується і може зберігатися в прохолодному сухому місці протягом сотень століть. Ідея використання ДНК для зберігання існує вже давно, ще в 1994 році. Основна причина полягає в тому, що інформація зберігається в комп’ютері та в нашому комп’ютері однаково. ДНК – оскільки обидва зберігають креслення інформації. Комп’ютер зберігає всі дані як 0 і 1, а ДНК зберігає всі дані живого організму за допомогою чотирьох основ – тиміну (T), гуаніну (G), аденіну (A) і цитозину (C). Таким чином, ДНК можна було б назвати стандартним запам'ятовуючим пристроєм, як і комп'ютер, якщо ці основи можна представити як 0 (основи A і C) і 1 (основи T і G). ДНК є міцною та довговічною, найпростішим відображенням є те, що наш генетичний код – схема всієї нашої інформації, що зберігається в ДНК – ефективно передається від одного покоління до наступного повторюваним способом. Усі гіганти програмного забезпечення та апаратного забезпечення зацікавлені у використанні синтетичної ДНК для зберігання величезних обсягів, щоб досягти своєї мети вирішення довгострокового архівування даних. Ідея полягає в тому, щоб спочатку перетворити комп’ютерний код 0 і 1 на код ДНК (A, C, T, G), потім перетворений код ДНК використовувати для виробництва синтетичних ниток ДНК, які потім можна помістити в холодне зберігання. За потреби ланцюги ДНК можна вилучити з холодного сховища, а інформацію про них розшифрувати за допомогою машини для секвенування ДНК, і послідовність ДНК нарешті перекладається назад у двійковий комп’ютерний формат 1 і 0 для зчитування на комп’ютері.

Це було показано1 що лише кілька грамів ДНК можуть зберігати квінтильйони байтів даних і зберігати їх недоторканими до 2000 років. Однак це просте розуміння зіткнулося з деякими проблемами. По-перше, це досить дорого, а також дуже повільно записувати дані в ДНК, тобто фактичне перетворення 0 і 1 в основи ДНК (A, T, C, G). По-друге, після того, як дані «записані» в ДНК, знайти та отримати файли стає складно, і для цього потрібна техніка, яка називається ДНК секвенування – процес визначення точного порядку основ у a ДНК молекула - після чого дані декодуються назад до 0 і 1 с.

Недавнє дослідження2 вчені з Microsoft Research і Вашингтонського університету досягли «випадкового доступу» до зберігання ДНК. Аспект «випадкового доступу» дуже важливий, оскільки це означає, що інформація може передаватися в або з місця (зазвичай пам'ять), у якому кожне місце, незалежно від того, де в послідовності, і може бути доступним безпосередньо. Використовуючи цю техніку довільного доступу, файли можна отримати із сховища ДНК вибірково в порівнянні з попереднім способом, коли для такого пошуку вимагалося послідовності та декодування всього набору даних ДНК, щоб знайти та витягти потрібних файлів. Важливість «випадкового доступу» ще більше підвищується, коли обсяг даних збільшується і стає величезним, оскільки він зменшує кількість послідовності, яку потрібно виконати. Це вперше в історії довільний доступ був показаний у такому великому масштабі. Дослідники також розробили алгоритм для ефективнішого декодування та відновлення даних з більшою толерантністю до помилок даних, що робить процедуру секвенування також швидшою. У цьому дослідженні було закодовано понад 13 мільйонів синтетичних олігонуклеотидів ДНК, які представляли собою дані розміром 200 МБ, що складалися з 35 файлів (містить відео, аудіо, зображення та текст) розміром від 29 КБ до 44 МБ. Ці файли були отримані окремо без помилок. Крім того, автори розробили нові алгоритми, які є більш надійними та толерантними до помилок при записі та читанні послідовностей ДНК. Це дослідження опубліковано в Природа Біотехнологія у серйозному прогресі, що демонструє життєздатну, великомасштабну систему для зберігання та пошуку ДНК.

Система зберігання ДНК виглядає дуже привабливо, оскільки вона має високу щільність даних, високу стабільність і її легко зберігати, але вона, очевидно, має багато проблем, перш ніж її можна буде прийняти в усьому світі. Декількома факторами є час і трудомістке декодування ДНК (секвенування), а також синтез ДНК. Техніка вимагає більшої точності та ширшого охоплення. Незважаючи на досягнення в цій галузі, точний формат, у якому дані зберігатимуться в довгостроковій перспективі ДНК все ще розвивається. Корпорація Майкрософт пообіцяла вдосконалити виробництво синтетичної ДНК і розв’язати проблеми, щоб розробити повністю працездатну ДНК системи зберігання до 2020 року.

***

{Ви можете прочитати оригінальну дослідницьку роботу, натиснувши посилання DOI, наведене нижче в списку цитованих джерел(ів)}

Джерела

1. Erlich Y and Zielinski D 2017. DNA Fountain забезпечує надійну й ефективну архітектуру зберігання. наук. 355 (6328). https://doi.org/10.1126/science.aaj2038

2. Organick L et al. 2018. Довільний доступ у великомасштабному сховищі даних ДНК. Природа Біотехнологія. 36 https://doi.org/10.1038/nbt.4079

Команда SCIEU
Команда SCIEUhttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Значні успіхи в науці. Вплив на людство. Надихаючі уми.

Підпишіться на нашу розсилку

Щоб бути в курсі всіх останніх новин, пропозицій та спеціальних оголошень.

Найпопулярніші статті

Нобелівська премія з фізики за внесок у фізику Attosecond Physics 

Нобелівську премію з фізики 2023 присудили...

Як аналіз ліпідів відкриває давні харчові звички та кулінарні практики

Хроматографія та специфічний ізотопний аналіз ліпідних залишків...

PARS: кращий інструмент для прогнозування астми у дітей

Комп’ютерний інструмент був створений і протестований для прогнозування...
- Реклама -
94,448ВентиляториЛюблю
47,679послідовникислідувати
1,772послідовникислідувати
30ПередплатникиПідписуватися