ما هو النموذج الأساسي؟
هو شبكة عصبونية اصطناعية تعمل بالذكاء الاصطناعي مدرَّبة على كمية كبيرة من البيانات الأولية، يتم تدريبها بواسطة التعلم غير الموّجه لإنجاز مجموعة واسعة من المهام.
تاريخ النموذج الأساسي
تمت صياغة مصطلح النموذج الأساسي لأول مرة من قِبل فريق ستانفورد للذكاء الاصطناعي. على الرغم من أن هذه النماذج كانت معروفة لدينا بشكلٍ غير مباشر بأسم النماذج اللغوية الكبيرة، وبعدها عام 2017 ظهر ما يعرف باسم النماذج التحويلية لتكون ولادة فكرة النماذج الأساسية، وفي عام 2018 تم تقديم النماذج الشهيرة وهي بيرت من جوجل وتشات جي بي تي من أوبن أيه آي.
أنواع النماذج الأساسية
يمكن تصنيف النماذج الأساسية إلى عدة أنواع حسب الغرض الذي صُممت له، ومن أشهر هذه الأنواع:
نماذج أساسية لمعالجة اللغة الطبيعية
تُعد النماذج اللغوية الكبيرة (LLMs) نماذج الأساس لمعالجة اللغة الطبيعية، بحيث يتم تدريب النماذج اللغوية الكبيرة على كميات ضخمة من مجموعات البيانات للتعرف على الأنماط والعلاقات الموجودة في البيانات النصية، وتهدف إلى تعلم كيفية تمثيل البيانات النصية بدقة.
ومن أمثلة هذه النماذج جي بي تي-3 وجي بي تي-4 إضافة لنموذج بيرت من جوجل لتعزيز قدرات محركات البحث.
نماذج أساسية للرؤية الحاسوبية
تعد نماذج الانتشار أمثلة شائعة للنماذج الأساسية للرؤية الحاسوبية. وظهرت نماذج الانتشار كفئة جديدة قوية من النماذج التوليدية العميقة مع أحدث الإمكانات في حالات الاستخدام المتعدد، مثل توليد الصور والبحث عن الصور وتوليد الفيديو وغيره، وتفوقت هذه النماذج على الشبكات التوليدية التنافسية بقدراتها التوليدية.
من أمثلتها نماذج مثل دال-2 (Dalle-2) وميدجورني، كما يمكن أن تعمل نماذج الانتشار كنماذج أساسية لمعالجة اللغات الطبيعية ومهام توليد الوسائط المختلفة مثل تحويل النص إلى فيديو وتحويل النص إلى صورة.