شرح تكنولوجيا أوبن إيه آي لاستخدام الذكاء الاصطناعي في كتابة القصص الخيالية وتوليد الأخبار المزيفة

في 14 فبراير، أطلقت مؤسسة الأبحاث اللاربحية أوبن إيه آي نموذجاً لغوياً جديداً قادراً على توليد مقاطع نثرية مُقنعة. وفي الواقع، فإنها مقنعة لدرجة أن الباحثين أحجموا عن جعل البرنامج مفتوح المصدر، على أمل إعاقة إمكانية استخدام هذه الطريقة كسلاح لتوليد الأخبار المزيفة على نطاق واسع.

على الرغم من أن هذه النتائج الممتازة تعتبر قفزة كبيرة بالنسبة لما حققته النماذج اللغوية الحالية، فإن الطريقة المستخدمة لتحقيقها ليست جديدة تماماً. وبدلاً من هذا، فقد تم التوصل إلى الإنجاز الجديد بشكل أساسي عن طريق تلقيم الخوارزمية بالمزيد من بيانات التدريب، وهي حيلة يبدو أيضاً أنها تشكل الأساس الذي اعتمدت عليه أغلبية الإنجازات الأخيرة في تعليم الذكاء الاصطناعي كيفية القراءة والكتابة. يقول بيرسي ليانج، البروفيسور المختص في علوم الحاسوب في جامعة ستانفورد: "يتفاجأ الكثيرون مما يمكن تحقيقه باستخدام المزيد من البيانات ونماذج أكبر".

إن المقاطع النصية التي ينتجها النموذج جيدة لدرجة تبدو كما لو أنها كلام كتبه البشر. ولكن هذا لا يعني وجود فهم حقيقي للغة، وهو الهدف الأسمى لأحد الحقول الفرعية من الذكاء الاصطناعي، والمعروف باسم معالجة اللغات الطبيعية (NLP). وهناك فكرة شبيهة في مجال الرؤية الحاسوبية، حيث تستطيع خوارزمية تشكيل صورة شديدة الواقعية من دون أي إدراك بصري لها. وفي الواقع، فإن تحقيق هذا المستوى من الفهم في الآلات ما زال مهمة عصية على باحثي معالجة اللغات الطبيعية. ويقدّر ليانج أن تحقيق هذا الهدف قد يستغرق عدة سنوات، وربما حتى عدة عقود، ومن المرجح أنه سيتضمن أساليب ليست موجودة بعد.

توجد حالياً أربع فلسفات لغوية مختلفة لتطوير أساليب معالجة اللغات الطبيعية.

لنبدأ مع فلسفة أوبن إيه آي.

1. الدلالات التوزيعية

الفلسفة اللغوية: تستمد الكلمات معانيها من طريقة استخدامها. وعلى سبيل المثال، فإن كلمتي "قط" و"كلب" مترابطتان في المعنى لأنهما تُستخدمان تقريباً بنفس الطريقة. حيث يمكنك أن تطعم وتداعب قطة أو كلباً، ولكن لا يمكنك أن تطعم أو تداعب برتقالة.

كيف تتجسد هذه الفلسفة في معالجة اللغات الطبيعية: كانت الخوارزميات المبنية على الدلالات التوزيعية من أهم أسس التطورات الأخيرة في معالجة اللغات الطبيعية. حيث أنها تعتمد على التعلم الآلي لمعالجة النص والعثور على الأنماط، وذلك بشكل أساسي عن طريق حساب وتيرة استخدام الكلمات وقربها بالنسبة لبعضها البعض. ويمكن للنموذج الناتج أن يستخدم هذه الأنماط لبناء جمل أو مقاطع كاملة، ويفيد في تنفيذ أشياء مثل الإكمال التلقائي للكلمات والجمل، وغير ذلك من الأنظمة النصية التوقعية. في السنوات الأخيرة، بدأ الباحثون أيضاً بإجراء التجارب على توزعات التتابعات العشوائية للمحارف بدلاً من الكلمات، بحيث تستطيع النماذج التعامل بشكل أكثر مرونة مع الاختصارات، وعلامات الترقيم، والكلمات العامية، وغيرها من الأشياء التي لا تظهر عادة في المعاجم، إضافة إلى اللغات التي لا توجد فيها فواصل واضحة بين الكلمات.

الحسنات: هذه الخوارزميات مرنة ويمكن استخدامها على نطاق واسع، لأنه يمكن تطبيقها في أي سياق، كما أنها تتعلم من البيانات غير المصنفة.

السيئات: النماذج الناتجة بهذه الطريقة لا تفهم الجمل التي تؤلفها فعلياً. ومن الناحية العملية، فإنها تقوم بتركيب نصوص نثرية اعتماداً على ترابط الكلمات.

2. الدلالات المؤطّرة

الفلسفة اللغوية: تُستخدم اللغة لوصف الأفعال والأحداث، وبالتالي فإن الجمل يمكن تقسيمها إلى مواضيع، وأفعال، ومُعدِّلات: من، ماذا، أين، متى.

كيف تتجسد هذه الفلسفة في معالجة اللغات الطبيعية: تعتمد خوارزميات الدلالات المؤطرة على مجموعة من القواعد أو الكثير من بيانات التدريب المصنفة حتى تتعلم كيفية تفكيك الجمل. وهو ما يجعلها بارعة على وجه خاص في فهم الأوامر البسيطة، وبالتالي فهي مفيدة في بوتات الدردشة والمساعدات الرقمية الصوتية. فإذا طلبت من أليكسا أن "تعثر على مطعم بأربعة نجوم ليوم غد"، على سبيل المثال، فإن خوارزمية كهذه ستتمكن من تنفيذ الجملة عن طريق تقسيمها إلى الفعل "تعثر" و(ماذا) ("مطعم بأربعة نجوم") و(متى) ("ليوم غد").

الحسنات: على عكس خوارزميات الدلالات التوزيعية التي لا تفهم النص التي تتعلم منه، فإن خوارزميات الدلالات المؤطّرة قادرة على تمييز الأجزاء المختلفة من المعلومات في الجملة. ويمكنها أن تجيب عن أسئلة مثل "متى سيقام هذا الحدث"؟

السلبيات: تستطيع هذه الخوارزميات أن تتعامل مع الجمل البسيطة للغاية فقط، ولهذا فهي غير قادرة على التقاط التفاصيل الدقيقة وغير المباشرة. ونظراً لحاجتها إلى الكثير من التدريب محدد السياق، فهي ليست مرنة.

3. دلالات النموذج النظري

الفلسفة اللغوية: تستخدم اللغة لإيصال المعرفة البشرية.

كيف تتجسد هذه الفلسفة في معالجة اللغات الطبيعية: بُنيت دلالات النموذج النظري على فكرة قديمة في الذكاء الاصطناعي،

وتقول هذه الفكرة أنه يمكن ترميز أو نمذجة كامل المعرفة البشرية باستخدام مجموعة من القواعد المنطقية. ولهذا، إذا كنت

تعرف أن الطيور تطير، وأن النسور طيور، فيمكنك أن تستنتج أن النسور تطير. ولكن الباحثين تخلوا عن هذا الأسلوب بسرعة، حيث أدركوا أن كل قاعدة كانت تتضمن عدداً كبيراً من الاستثناءات، مثل البطريق الذي لا يطير على الرغم من أنه من الطيور. غير أن الخوارزميات المبنية على دلالات النموذج النظري ما زالت مفيد لاستخلاص المعلومات من النماذج المعرفية، مثل قواعد البيانات. وعلى غرار خوارزميات الدلالات المؤطرة، فإنها تحلل الجملة عن طريق تفكيكها إلى أجزاء. ولكن الفرق أن الدلالات المؤطرة تعرف هذه الأجزاء على أنها من وماذا وأين ومتى، غير أن دلالات النموذج النظري تعرفها على أنها القواعد النظرية التي ترمز المعرفة. وعلى سبيل المثال، إذا تأملنا هذا السؤال: "ما هي أكبر مدينة في أوروبا من حيث عدد السكان؟" فإن خوارزمية النموذج النظري ستفككها إلى مجموعة متتابعة من الاستعلامات: "ما هي جميع المدن في العالم؟" "أي من هذه المدن يقع في أوروبا؟" "ما عدد السكان في هذه المدن؟" "ما هو أكبر عدد سكان من هذه الأعداد؟"، وبذلك تتمكن من التعامل مع النموذج المعرفي حتى تقدم لك الجواب النهائي.

الحسنات: تمنح هذه الخوارزميات الآلات القدرة على الإجابة عن أسئلة معقدة ذات تفاصيل دقيقة.

السيئات: تتطلب هذه الخوارزميات نموذجاً معرفياً، وهو ما يتطلب الكثير من الوقت لبنائه، كما أنه ليس مرناً ولا يتغير بسهولة حسب السياق.

4. الدلالات الهدفية

الفلسفة اللغوية: تستمد اللغة معناها من الخبرة الواقعية. أي أن البشر ابتكروا اللغة لتحقيق أهدافهم، ولهذا يجب فهمها ضمن سياق عالمنا الذي توجهه الأهداف.

كيف تتجسد هذه الفلسفة في معالجة اللغات الطبيعية: يُعتبر هذا الأسلوب الأحدث، والذي يعتقد ليانج أنه يحمل إمكانات كامنة أكثر من غيره. ويقوم على محاكاة كيفية تعلم البشر للغة على مدى حياتهم: حيث تبدأ الآلة بحالة فارغة، وتتعلم كيفية ربط الكلمات مع المعاني الصحيحة عبر الحوار والتفاعل. وفي مثال بسيط، إذا أردت تعليم الحاسوب كيف يحرك الأجسام في عالم افتراضي، ستعطيه أمراً مثل "قم بتحريك الكتلة الحمراء إلى اليسار" وتريه ما تعني. ومع الوقت، سيتعلم الحاسوب فهم وتنفيذ الأوامر بدون مساعدة.

الحسنات: من الناحية النظرية، يفترض بهذه الخوارزميات أن تكون مرنة للغاية، وتقترب أكثر من غيرها إلى الفهم الحقيقي للغة.

السيئات: تتطلب عملية التعليم الكثير من الوقت، كما أنه توجد الكثير من الكلمات والجمل التي لا يمكن توضيحها بسهولة مثل "قم بتحريك الكتلة الحمراء".

على المدى القصير، يعتقد ليانج أن حقل معالجة اللغات الطبيعية سيشهد الكثير من التقدم عن طريق التقنيات الموجودة حالياً، خصوصاً تلك المبنية على الدلالات التوزيعية. ولكن على المدى البعيد، يعتقد أنها جميعاً محدودة، ويقول: "هناك على الأرجح فجوة نوعية بين طريقة فهم البشر للغة والعالم، وقدرات النماذج الحالية". ويضيف أن تجاوز هذه الفجوة قد يتطلب أسلوباً جديداً في التفكير، والكثير من الوقت أيضاً.