راهکار شرکت کاتالوگ؛ ذخیره سازی داده ها روی دی‌ان‌ای
ذخیره‌سازی داده‌ها روی دی‌ان‌ای و نگه‌داری در یخچال
بشر سالانه، حجم بسیار زیادی داده تولید می‌کند و این روند تولید داده، به‌طور چشم‌گیری در حال افزایش است. بخش زیادی از این داده‌ها، داده‌های مهمی هستند که باید ذخیره شده و برای مدت طولانی و به‌طور ایمن نگه‌داری شوند. شماری از محققان، دانشگاهیان و فعالان حوزه صنعت با پیش‌بینی آن‌چه در سال‌های آینده نیاز خواهند داشت، به‌دنبال راهکاری بهینه و مناسب برای ذخیره‌سازی داده‌های‌شان هستند. برخی معتقدند ذخیره‌سازهای زیستی و از جمله ذخیره‌سازهای مبتنی بر مولکول‌های دی‌اِن‌اِی بهترین پاسخ به این چالش هستند.

شرکتی دانش‌بنیان به تازگی مدعی شده که راهکاری به نسبت سریع و ارزان‌ برای ذخیره‌سازی داده روی دی‌اِن‌اِی یافته و دستگاهی توسعه داده که ممکن است آینده ذخیره‌سازی باشد یا دست‌کم راه را برای ذخیره‌سازی زیستی هموار کند.
از همان آغاز توسعه سامانه‌های پردازشی دیجیتال، ذخیره‌سازی داده‌ها یکی از چالش‌های اساسی بوده است. از آن سال‌ها تا به امروز فناوری‌های ذخیره‌ساز تغییرات زیادی داشته‌اند و اگرچه شاهد پیشرفت‌های زیادی بوده‌ایم، به همان نسبت سطح توقع از سامانه‌های ذخیره‌ساز رشد پیدا کرده و نیاز به راهکارهای بهینه‌تر ذخیره‌سازی را دوچندان کرده است. در سال ۲۰۱۶  بیش از ده تریلیون گیگابایت داده دیجیتال تولید شده و این میزان، سالانه رو به افزایش است (تصویر ۱).

شکل 1-1- پیش‌بینی میزان رشد تولید داده تا شش سال آینده 

شکل 2-1: روند رشد چگالی ظرفیت ذخیره‌سازی

پیش‌بینی می‌شود تا شش سال آینده بیش از ۱۶۰ زتابایت داده تولید خواهد شد. داده‌هایی که به‌طور روزانه در قالب عکس، متن، پیام و نظایر آن‌ها تولید می‌کنیم، فقط بخشی از این آمار هستند. بخش مهمی از داده‌هایی که سالانه تولید می‌شوند حاصل آزمایش‌ها و پژوهش‌های محققانی است که در حوزه‌های مختلف از پزشکی گرفته تا ستاره‌شناسی و امور مالی به تحقیق مشغول هستند. این‌ها داده‌های مهمی هستند که باید راهی برای ذخیره‌سازی ایمن‌ آن‌ها یافت ( تصویر ۲).

شکل۲ - بخش مهمی از داده‌هایی که در جهان تولید می‌شوند باید حتماً ذخیره شوند.

در حال حاضر داده‌های مهم روی دیسک‌های سخت یا فضای ابری ذخیره می‌شوند و با توجه به افزایش تولید داده‌هایی که باید ذخیره شوند، در آینده‌ای نزدیک استفاده از رسانه‌های ذخیره‌ساز سنتی  پاسخ‌گوی این نیاز نخواهند بود. این داده‌ها فضای زیادی اشغال می‌کنند و لازم است هر چند سال یک‌بار به‌روز شده و با نیازهای روز هماهنگ شوند. 

ذخیره‌سازی روی دی‌ان‌ای

رشته‌های دی‌اِن‌اِی بسیار کوچک هستند و نگه‌داری آن‌ها کار ساده‌ای نیست، اما این مولکول‌های زیستی می‌توانند به‌جز اطلاعات زیستی، داده‌های دیگری درون خود ذخیره کنند. ایده استفاده از دی‌اِن‌اِی برای ذخیره اطلاعات ایده جدیدی نیست و تا به‌امروز برای توسعه سامانه‌های ذخیره‌ساز مبتنی بر دی‌اِن‌اِی تلاش‌های زیادی صورت گرفته است. به‌عنوان مثال، سال گذشته محققان مایکروسافت و دانشگاه واشنگتن اعلام کردند که موفق شده‌اند ۳۵ فایل دیجیتال مختلف با حجمی بیش از ۲۰۰ مگابایت را روی دی‌اِن‌اِی  ذخیره کنند. برخی مدعی هستند که با استفاده از این رویکرد ذخیره‌سازی می‌توان همه داده‌های روی کره زمین را در صندق عقب یک خودرو جای داد! اما چالش‌های بزرگی سر راه تحقق این رؤیا وجود دارد که مهم‌ترین آن‌ها، هزینه بالای این ذخیره‌سازی است. مثلاً ذخیره‌سازی یک فایل صوتی استریو روی دی‌اِن‌اِی حدود صدهزار دلار هزینه دارد. سرعت پایین ذخیره‌سازی و بازیابی داده‌ها در این روش چالش مهم دیگری است که باید راهکاری برای آن یافت. شرکت نوپای کاتالوگ (Catalog) که کار خود را از  مرکز  Life Lab هاروارد آغاز کرده  برای رفع این دو مشکل راهکار پیشنهاد داده است. این شرکت مدعی است که توانسته تمام متون نسخه انگلیسی دانشنامه آنلاین ویکی‌پدیا را درون مولکول دی‌اِن‌اِی ذخیره کند (تصویر۳). 

شکل۳ -  شرکت کاتالوگ ۱۶ گیگابایت داده مربوط به نسخه انگلیسی دانشنامه ویکی‌پدیا را بر روی دی‌اِن‌اِی ذخیره کرده است.

راهکاری سریع‌تر و ارزان‌تر برای ذخیره‌سازی داده‌ها

شرکت کاتالوگ که توسط دانشجویان اِم‌آی‌تی و هاروارد تأسیس شده، مدعی است که برای ساخت دی‌اِن‌اِی‌های سفارشی شده برای استفاده در فرآیند ذخیره‌سازی، به راهکاری سریع‌تر و ارزان‌تر دست یافته است.  ایده کاتالوگ این است که به‌جای روش مرسوم یعنی ذخیره کردن داده‌ها روی یک رشته بلند دی‌اِن‌اِی، این‌کار روی قطعات کوچک‌تری انجام شود و سپس این قطعات دی‌اِن‌اِی توسط آنزیم‌هایی به‌هم متصل شوند تا رشته نهایی حامل فایل اصلی به‌دست آید. چگونگی چیده‌ شدن این قطعات در کنار هم، امکان ذخیره‌سازی محتواهای مختلفی را فراهم می‌کند. در این روش داده مورد نظر در قالب دودویی به رشته‌ای از صفرها و یک‌ها تبدیل می‌شود. هر جفت از این اعداد باینری به یک مولکول ( نوکلئوتید که  با نام‌های A و C و T و G شناخته می‌شوند) نسبت داده می‌شود. به‌طور مثال، ۰۰ به A، ۰۱ به C،  11 به T، 10 به G ( تصویر۴).

شکل۴ - داده‌ها به‌صورت جفت‌های دودویی (صفر و یک) به مولکول‌ها نسبت داده می‌شوند. به بیان دیگر هر  نوکلئوتید، نقش یک جفت صفر و یک دیجیتال را ایفا می‌کند.
 

به این ترتیب داده دیجیتال که در ‌واقع ترکیبی از این صفرها و یک‌ها است با کمک این کدگذاری روی ماده ژنتیکی ذخیره می‌شود. ظرف کوچک حاوی این ماده را می‌توان در هر یخچالی که دمای ۴ درجه سانتیگراد را تأمین می‌کند نگه‌داری کرد. به ادعای شرکت کاتالوگ، این روش، هزینه ذخیره‌سازی روی دی‌اِن‌اِی را به‌طور چشم‌گیری کاهش خواهد داد. 

کمی نزدیک‌تر

ایده کلیدی این شرکت جدا کردن فرآیند تولید مولکول‌های دی‌اِن‌اِی از فرآیند کدگذاری داده‌های دیجیتال است. در این روش به‌جای این‌که مجبور باشیم برای هر بار ذخیره‌سازی، دی‌اِن‌اِی را از نو بسازیم، قطعاتی از پیش ساخته شده در اختیار داریم که این قطعات دی‌اِن‌اِی توسط دستگاه با ترتیب دلخواه در کنار هم قرار داده شده و به هم متصل می‌شوند تا محتوای مورد نظر ذخیره گردد. اگرچه در فرآیند پیشنهادی شرکت کاتالوگ از شمار نسبتاً کمتری مولکول‌های دی‌اِن‌اِی استفاده می‌شود (کمتر از ۲۰۰) اما تعداد حالاتی که می‌توان آن‌ها را به‌هم متصل کرد به‌طور نمایی افزایش می‌یابد که رمز کار در همین مسئله مستتر است. راهکار کاتالوگ، فرآیند تهیه مولکول‌ها یعنی دقیقاً همان بخشی از کار ذخیره‌سازی روی دی‌اِن‌اِی که پرهزینه و کند است را ساده‌تر می‌کند. این روش تقریباً شبیه ساخت جملات با حروف الفباست. تعداد مشخص و محدودی حروف الفبا وجود دارد ولی می‌توان با کنار هم قرار دادن این کلمات، جملاتی متنوع ساخت. در روش کاتالوگ‌ هم مانند همین مثال، گروهی از رشته‌های کوچک‌تر دی‌اِن‌اِی داریم که بخشی از محتوا روی آن‌ها ذخیره شده و با کنار هم قرار دادن آن‌ها محتوای کلی شکل می‌گیرد. در مقام مقایسه باید یادآوری کرد که روش‌های فعلی ذخیره داده‌ها در دی‌اِن‌اِی میلیاردها دلار هزینه دارد و چندین هفته زمان می‌برد.

مطلب پیشنهادی

اطلاعات چگونه روی DNA ذخیره‌سازی می‌شوند؟
کنکاشی در یک ایده مافوق تصور

رَمِ زیستی

کاتالوگ در روش پیشنهادی خود از یک سامانه آدرس‌دهی استفاده می‌کند که امکان ذخیره کردن مجموعه‌های بزرگی از داده را میسر می‌کند. این احتمال وجود دارد که داده‌ها روی رشته‌های طویلی از دی‌اِن‌اِی ذخیره شوند، اما با روش کاتالوگ اطلاعات در هر کجای این رشته نوشته شده باشد، قابل خواندن و بازیابی خواهد بود. به عبارت دیگر، آن‌چه کاتالوگ با استفاده از دی‌اِن‌اِی ارائه کرده در حقیقت نوعی حافظه با دسترسی تصادفی (یا به اصطلاح نوعی رَم) است و نه حافظه‌ای با دسترسی ترتیبی که سال‌ها پیش در حافظه‌هایی نظیر نوارهای مغناطیسی معمول بود.
برای بازخوانی داده‌های ذخیره شده روی دی‌اِن‌اِی می‌توان از دستگاه‌های توالی‌یاب دی‌اِن‌اِی موجود در بازار استفاده کرد (تصویر۵‌).

شکل ۵ - برای خواندن داده‌های ذخیره شده روی دی‌اِن‌اِی می‌توان از دستگاه‌های توالی‌یاب تجاری استفاده کرد.

بطوریکه حتی ممکن است این روش ذخیره‌سازی به‌عنوان کاربردی جدید و پرسود برای صنعت ساخت دستگاه‌‌های توالی‌یاب تجاری مطرح شود. زیرا در صورت فراگیر شدن ذخیره‌سازی اطلاعات روی دی‌اِن‌اِی، برای خواندن آن‌چه روی دی‌اِن‌اِی ذخیره شده به توالی‌یاب نیاز خواهیم داشت و در این صورت بازار توالی‌یابی هم بهبود خواهد یافت. البته باید این نکته را به یاد داشته باشیم که بازخوانی اطلاعات ذخیره شده روی دی‌اِن‌اِی به همان سادگی و سرعتی نیست که حافظه‌های مرسوم عرضه می‌کنند. این روش ذخیره‌سازی بیشتر در مواقعی که ذخیره‌سازی طولانی مدتِ حجم زیادی از داده نیاز است (نظیر بایگانی داده‌ها) مفید خواهد بود و شرکت کاتالوگ هم چنین بازاری را هدف گرفته است.

اتاقی برای نوشتن

TechnologyReview سال گذشته میلادی به طرحی گرافیکی از این ذخیره‌ساز شرکت کاتالوگ دست‌ یافت که ابعادی به اندازه یک اتوبوس داشت (تصویر۶).

شکل۶ - بالا: طرحی گرافیکی از آنچه کاتالوگ قصد دارد عرضه کند.
پایین- نمونه‌ای اولیه از دستگاه  دی‌اِن‌اِی‌نویس.

کاتالوگ وعده داد که امسال نمونه‌ای اولیه با قابلیت ذخیره‌سازی یک ترابیت داده در روز را عرضه خواهد کرد که در نوع خود یک دستاورد بزرگ محسوب می‌شود. با این حال این شرکت اعلام کرده است که عرضه نمونه‌ای تجاری با قابلیت ذخیره‌سازی یک پتابیت داده در روز تا سال ۲۰۲۱ به طول خواهد انجامید.
 آن‌چه در طرح اولیه دیده می‌شود شبیه اتاقی با یک در است که فضای کافی برای کار چند تکنسین را فراهم می‌کند. در این اتاق صدها ظرف محتوی دی‌اِن‌اِی که آماده استفاده هستند، قرار دارد و رشته‌های دی‌اِن‌اِی برای دستیابی به توالی مورد نظر و به‌طور خودکار با هم ترکیب می‌شوند. علاوه بر این به منظور بازیابی داده‌های ذخیره شده، چندین دستگاه توالی‌یاب بهینه‌سازی شده هم وجود دارد. به نوشته این وب‌سایت، این طرح شرکت کاتالوگ ما را به یاد نخستین کامپیوتری می‌اندازد که در دهه ۴۰ میلادی ساخته شد و به بزرگی یک اتاق بود و بیش از ۱۸ هزار لامپ خلاء داشت (تصویر ۷) .

شکل۷ - ماشین دی‌اِن‌اِی‌نویس شرکت کاتالوگ، قادر است با سرعت چهارمگابیت بر ثانیه داده‌ها را بر روی  دی‌اِن‌اِی بنویسد.

ذخیره‌سازی روی دی‌اِن‌اِی  به‌عنوان سرویس

درایوهای دیسک سخت قابل حمل با ظرفیت ذخیره‌سازی یک ترابایت، قیمتی کمتر از صد دلار دارند و فرآیند ذخیره‌سازی این حجم از داده روی آن‌ها فقط چند ساعت زمان می‌برد. حتی اگر روش کاتالوگ به همان خوبی باشد که تبلیغ می‌کند باز هم این شرکت  نیازمند صرف وقت و تلاش زیادی است تا بتواند در مقابل قیمت و سرعت انتقال داده‌ای که رقبای سیلیکونی‌اش ارائه می‌کنند حرفی برای گفتن
داشته باشد. 
سرعت ذخیره‌سازی و بازیابی اطلاعات در این روش در مقایسه با نمونه‌های سیلیکونی بسیار کم است و نمی‌توان انتظار داشت که از این شیوه دست‌کم در آینده نزدیک برای استفاده در دستگاه‌های مصرفی نظیر تلفن همراه استفاده شود! اما ذخیره‌سازی روی دی‌اِن‌اِی راهکاری مناسب برای بایگانی طولانی مدت حجم بالایی از داده‌ها است و در این کاربرد می‌تواند رقیب ذخیره‌سازهای فعلی باشد. این شرکت با کامل شدن دستگاه، قصد فروش آن‌را ندارد، بلکه در نظر دارد از راه عرضه خدمات ذخیره‌سازی روی دی‌اِن‌اِی، کسب درآمد کند. شرکت کاتالوگ اعلام کرده که با نهادهای دولتی، پروژه‌های تحقیقاتی بین‌المللی که نیاز به مدیریت حجم بسیار زیادی از داده‌ها دارند، فعالان بزرگ حوزه‌هایی نظیر نفت و گاز، رسانه و سرگرمی، مالی و سایر صنایع مذاکراتی داشته است.

آینده پردازش

Hyunjun Park مدیر اجرایی ارشد و یکی از بنیان‌گذاران شرکت کاتالوگ می‌گوید: « وقتی از ذخیره‌سازی ابری سخن می‌گوییم گمان می‌کنیم که برای ذخیره‌سازی داده‌های‌مان، فضایی بیکران در اختیار داریم، اما واقعیت این است که فضای ابری هم در‌ واقع یک فضای فیزیکی ذخیره‌سازی و محدود است.» او معتقد است که در آینده‌ای نزدیک حجم داده‌های مفیدی که تولید می‌کنیم آن‌قدر زیاد خواهد شد که عملاً رسانه‌های ذخیر‌ه‌سازی فعلی جواب‌گوی این حجم داده نخواهند بود. شرکت او مدعی است با راهکار فوق می‌توان همه داده‌های روی کره زمین را در فضایی به اندازه یک کمد لباس جای داد! به عقیده کارشناسان، دی‌اِن‌اِی فقط برای ذخیره‌سازی داده‌ها کاربرد نخواهد داشت بلکه می‌توان از آن در زمینه انتقال داده نیز استفاده کرد. به‌عنوان مثال، شاید از دی‌اِن‌اِی برای انتقال ساده‌تر و مطمئن‌تر اطلاعات در سفرهای فضایی استفاده شود چیزی که در صورت تحقق سکونت انسان در سایر سیارات بسیار به کمک بشر خواهد آمد.


ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را می‌توانید از دکه‌های روزنامه فروشی تهران و شهرستان‌ها تهیه کنید. همچنین می‌توانید برای مطالعه شماره‌ها مختلف آن به کتابخانه‌های عمومی سراسر کشور مراجعه نمایید.

آخرین نسخه ماهنامه شبکه را دریافت کنید
برای دانلود ماهنامه شبکه 221 با پرونده ویژه «ترفندهای سیستم‌عامل‌ها» اینجا کلیک کنید.

اشتراک ماهنامه شبکه
اشتراک ماهنامه شبکه یکی دیگر از راه‌های دسترسی به مطالب مجله است؛ به ویژه اشتراک آنلاین که با قیمتی مناسب محتوای کامل مجله، شامل مطالب و آگهی‌ها را در ختیار شما قرار می‌دهد.

برچسب: 

مطالب پربازدید روز

پشتیبانی توسط ایران دروپال