كيف يُستخدم الحمض النووي لتخزين البيانات؟

5 دقائق
كيف يُستخدم الحمض النووي لتخزين البيانات؟
حقوق الصورة: shutterstock.com/ Wirestock Creators

في عصر الثورة الرقمية الذي نعيشه حالياً، ننتج يومياً قدراً هائلاً من البيانات يُقدّر بـ 2.5 مليون غيغابايت، وإذا استمر الأمر على هذا المنوال، لن تبقى وسائل التخزين قادرة على استيعاب هذه البيانات، لذا بحث العلماء عن بديل وتوصلوا إلى طريقة تمكّنهم من تشفير البيانات الرقمية ضمن الحمض النووي، ليكون هذا أوسع نظام تخزين بيانات تم اختراعه على الإطلاق. فكيف يمكن أن يتم ذلك؟ 

البشرية والبيانات

مع تطور البشرية، تطورت وسائل تخزين البيانات والمعلومات؛ من الكتابة على جدران الكهوف إلى الرقم الطينية، حتى اختراع الورق، والأقراص الصلبة حديثاً، وما زال هذا التطور مستمراً، وسيبقى كذلك. لكن هذه الطرق معظمها قصير العمر نسبياً، وكثافة التخزين فيها منخفضة، ولن تصبح ذات جدوى في تخزين القدر الهائل من البيانات الذي ننتجه. 

يوجد على الأرض الآن 10 تريليونات غيغابايت من البيانات الرقمية، وينتج البشر يومياً 2.5 مليون غيغابايت أخرى من البيانات تقريباً. وأيضاً، تُقدّر البيانات التي سينتجها البشر حتى عام 2025 بنحو 175 زيتابايت (1 زيتابايت = 1 مليون بيتابايت)، وهي بيانات يمكن تخزينها نظرياً في 81 كيلوغراماً تقريباً من الحمض النووي.

يتم تخزين الكثير من هذه البيانات في منشآت هائلة تُعرف باسم مراكز بيانات إكسابايت (إكسابايت هو 1 مليار غيغابايت)، والتي يمكن أن تكون بحجم عدة ملاعب كرة القدم، وتبلغ تكلفة بنائها وصيانتها مليارات الدولارات. 

يعتقد العديد من العلماء أن الحل البديل يكمن في الجزيء الذي يحتوي على معلوماتنا الجينية: الحمض النووي، والذي تطور لتخزين كميات هائلة من المعلومات بكثافة عالية جداً.

إن نظام تخزين البيانات ضمن الحمض النووي قادر على تخزين 215 بيتابايت (215 مليون غيغابايت) في غرام واحد من الحمض النووي، وهذا ما يقدّر بتخزين كل البيانات التي سجلها البشر في حاوية بحجم ووزن شاحنتين. وبالتأكيد، يمكن لهذا الرقم أن يتغير مع تقدم الأبحاث.

اقرأ أيضاً: هل يمكن تخزين البيانات في الحمض النووي للكائنات؟

كيف يمكن تخزين البيانات ضمن الحمض النووي؟ 

تعمل الحواسيب بنظام ترميز باللغة الثنائية (0، 1). في المقابل، تتكون جزيئات الحمض النووي من أربعة أنواع من النيوكليوتيدات، يُرمز لكل منها بحرف، وهي: الأدينين (A)، الثايمين (T)، الغوانين (G)، والسيتوزين (C). إن ترتيبها بتسلسلات محددة هو أساس شيفرات الحمض النووي، ويوفّر دليل التعليمات لبناء كل كائن حي على وجه الأرض. 

منذ اكتشاف الحمض النووي حتى اليوم، تمكن العلماء من تفسير طريقة بناء الحمض النووي بشكل جيد جداً، واستطاعوا تطبيقه على نطاق واسع في الطب والمستحضرات الصيدلانية وتطوير الوقود الحيوي مثلاً. حتى إنهم استطاعوا صناعة جزيئات الحمض النووي من الصفر من خلال كتابة تسلسلات طويلة من الأحرف A و C و G و T ثم إعادة قراءة تلك التسلسلات مرة أخرى. على سبيل المثال، يمكن استخدام G وC لتمثيل 0 بينما A وT لتمثيل 1. هذه العملية مماثلة لكيفية تخزين الكمبيوتر للمعلومات الثنائية، ومن هنا استلهم العلماء فكرة تخزين البيانات ضمن جزيئات الحمض النووي.

أثبتت هذه الطريقة نجاحها، لكن قراءة وكتابة الملفات المشفرة بالحمض النووي تستغرق وقتاً طويلاً، إذ يستغرق ضم أساس نوكليوتيدي واحد إلى الحمض النووي نحو ثانية واحدة. لذلك قد تستغرق كتابة ملف أرشيف بهذا المعدل عقوداً، لكن بالتأكيد سيتمكن الباحثون مستقبلاً من تخطي هذه العقبة.

وعندما يريد الباحثون استرجاع البيانات المخزنة ضمن الحمض النووي، يستخدمون تقنية تفاعل البوليميراز المتسلسل PCR، حيث يتعرف البادئ على مجال معين ضمن شريط الحمض النووي الذي يحمل البيانات المطلوبة، ومن ثم يتم تضخيمه.

يتم تمييز هذه المواد المطلوبة بجزيئات فلورية أو مغناطيسية، ما يجعل من السهل سحبها وتحديد أي تطابق من العينة، ويسمح ذلك بإزالة الملف المطلوب مع ترك باقي الحمض النووي سليماً لإعادة تخزينه.

اقرأ أيضاً: هل فكرت يوماَ أن تخزِّن ملفاتك المهمة داخل حمضك النووي؟

كيف تتحول الشيفرات من الأصفار والواحدات إلى النكليوتيدات؟

من أهم الخطوات التي يتم فيها استخدام هذه التقنية هي ترجمة ملفات البيانات من اللغة الثنائية (الأصفار والواحدات) التي تفهمها الحواسيب، إلى شيفرات مكونة من أربعة أحرف، تمثّل النكليوتيدات الأربعة التي يتكون منها الحمض النووي، والتي يفهمها علم الأحياء.

وهنا، طوّر علماء من مختبر لوس ألاموس الوطني برنامجاً يمكنه تأدية هذه الترجمة المطلوبة، ويسمى «أيه دي إس كوديكس» (ADS Codex)، وهو جزء رئيسي من برنامج تخزين المعلومات الجزيئية (MIST) الخاص بمشاريع البحث المتقدم للذكاء (IARPA). 

يسعى برنامج تخزين المعلومات الجزيئية إلى توفير سعة تخزين ميسورة التكلفة وأكبر وأطول أمداً لعمليات البيانات الضخمة في الحكومة والقطاع الخاص، بهدف قصير المدى يتمثل في كتابة واحد تيرابايت، وقراءة 10 تيرابايت في غضون 24 ساعة بتكلفة قدرها 1000 دولار.

اقرأ أيضاً: ما مصير حوسبة الحمض النووي اليوم وغيرها من بدائل السيليكون؟

أولى محاولات تخزين البيانات ضمن الحمض النووي 

في أول محاولة ناجحة، استطاع علماء الوراثة من جامعة هارفارد عام 2017، ترميز كتاب مكون من 52 ألف كلمة في آلاف قطع الحمض النووي. كان مخطط الترميز الخاص بهم غير فعّال نسبياً، ومع ذلك، كان بإمكانه تخزين 1.28 بيتابايت فقط لكل غرام من الحمض النووي. 

تحسّنت التقنية في المحاولات التالية، واستطاع الباحثون إيجاد طرق أفضل، لكن لم يتمكن أي منهم من تخزين أكثر من نصف ما يُعتقد أن الحمض النووي قادر على تخزينه، وهو 1.8 بت من البيانات لكل نوكليوتيد من الحمض النووي. 

نظر باحثون آخرون من جامعة كولومبيا ومركز الجينوم في نيويورك، في الخوارزميات التي كانت تُستخدم لترميز البيانات وفك تشفيرها. وبدأوا بستة ملفات، تشمل نظام تشغيل حاسوب كامل، وفيروس حاسوب، وفيلم فرنسي، ودراسة من عام 1948. 

حوّل الباحثون بدايةً هذه الملفات إلى سلاسل ثنائية من الأصفار والواحدات، وضغطوها في ملف رئيسي واحد، ثم قسموا البيانات إلى سلاسل قصيرة من التعليمات البرمجية الثنائية، وابتكروا خوارزمية تسمى نافورة الحمض النووي، والتي جمعت بشكل عشوائي الخيوط في ما يسمى بالقطيرات، والتي أضافوا إليها علامات إضافية للمساعدة في إعادة تجميعها بالترتيب الصحيح لاحقاً. إجمالاً، أنشأ الباحثون قائمة رقمية تضم 72000 خيط من الحمض النووي، طول كل منها 200 أساس نوكليوتيدي.

أُرسلت هذه الملفات كملفات نصية إلى شركة تويست بايوساينس (Twist Bioscience) الناشئة في سان فرانسيسكو في كاليفورنيا، والتي جمّعت بعد ذلك خيوط الحمض النووي. بعد أسبوعين، استلم الباحثون عبر البريد قارورة تحتوي على الحمض النووي المرمّز لملفاتهم. 

وفي جامعة تيانجين، صمم باحثون كروموسوماً اصطناعياً للخميرة، وخزّنوا فيه صورتين وفيديو، ونجحوا في تشغيل البيانات المشفرة في أكثر من 95% من التسلسل. ومع تكاثر الخميرة، يتم نسخ الحمض النووي الخاص بها، بالإضافة إلى الكروموسوم الصناعي الجديد حامل البيانات حتى 100 جيل.

مزايا تخزين البيانات ضمن الحمض النووي

تتمتع جزيئات الحمض النووي بالعديد من المزايا التي جعلت من الممكن اعتمادها كوسيلة لتخزين البيانات الرقمية:

  • تكون الجزيئات فائقة الصغر، ويمكن حفظها في مساحات صغيرة.
  • يمكن تخزين كمية كبيرة من البيانات بكميات ضئيلة من الحمض النووي، بسبب الكثافة العالية للحمض النووي.
  • تبقى الجزيئات مستقرة لمئات الآلاف من السنين إذا تم حفظها في مكان بارد وجاف دون أن تتحلل، وغالباً ما يتم تغليفها بالملح لغرض تخزين البيانات.
  • لا يتطلب حفظها سوى مقدار ضئيل من الطاقة، وهو المقدار الذي يحافظ على برودتها.
  • يمكن للبشر فك تشفيرها طالما هم قادرون على فهم الحمض النووي وقراءته.
  • يمكن للتقنيات الجديدة كتابة وقراءة كميات كبيرة من الحمض النووي في وقت واحد، ما يسمح بتوسيع نطاقه.
  • لا يتطلب الحمض النووي صيانة، ويمكن نسخ الملفات المخزنة في الحمض النووي بسهولة.

عيوب طريقة تخزين البيانات ضمن الحمض النووي 

على الرغم من أن هذه الطريقة في تخزين البيانات واعدة للغاية، فإنها تواجه بعض العقبات: 

  • تكلفة تخزين 2 ميغابايت من البيانات 7000 دولار، و2000 دولار أخرى لقراءتها من جديد. ومن المرجح أن تنخفض التكلفة بمرور الوقت. 
  • مقارنةً بالأشكال الأخرى لتخزين البيانات، فإن الكتابة والقراءة إلى الحمض النووي بطيئة نسبياً، لذلك لن تكون هذه التكنولوجيا مناسبة إذا كانت هناك حاجة إلى البيانات على الفور، ولكنها ستكون مثالية لغرض الأرشفة. 
  • يواجه الباحثون صعوبة في تحديد جزيئة الحمض النووي التي تحمل البيانات المطلوبة، إذ يمكن تشبيهها بالبحث عن إبرة في كومة قش، كما أن معدلات الخطأ أثناء الكتابة إلى التخزين الجزيئي باستخدام تخليق الحمض النووي عالية جداً، وتصحيحها أكثر صعوبة.

اقرأ أيضاً: تعرف إلى أهم طرق تخزين البيانات الضخمة

كيف يتجاوز العلماء هذه العقبات؟ 

إحدى الطرق المكتشفة لخفض التكلفة كانت من تطوير باحثين في جامعة هارفارد ومعهد إم آي تي، فقد استخدموا الحمض النووي الاصطناعي القصير كوسيط لتخزين المعلومات قصيرة المدى، واستطاعوا تخزين كتاب كامل، بما فيه من نصوص وصور تُقدّر بنحو 5.27 ميغابايت.

تمكن باحثون من إم آي تي أيضاً من تطوير طريقة تساعد على انتقاء الملف المطلوب من خليط من قطع عديدة من الحمض النووي وبسهولة. وذلك من خلال تغليف كل ملف بيانات في جسيم من السيليكا سعته 6 ميكرومتر، وتمييزه بتسلسلات قصيرة من الحمض النووي تكشف عن المحتويات. 

باستخدام هذا النهج، أظهر الباحثون أنه يمكنهم بدقة سحب الصور الفردية المخزنة في قطع الحمض النووي التي يبلغ طولها نحو 3000 نيوكليوتيد، وهو ما يعادل نحو 100 بايت، من مجموعة من 20 صورة. 

ما زالت هذه التكنولوجيا في مهدها، وفي انتظارها دراسات وأبحاث مطولة حتى ترى النور، وتنتشر على نطاق واسع، لتستفيد البشرية من قدرة الحمض النووي على تخزين الكميات الهائلة من البيانات.

المحتوى محمي