خلال السنوات الأخيرة، برزت تكنولوجيا الأجهزة المحمولة كمحرك أساسي للنمو الاقتصادي، وحفّزت إنفاقاً هائلاً للشركات في مجالات البحث والتطوير والبنية التحتية، لدرجة تجعل التغييرات العميقة التي أحدثتها في حياتنا اليومية أكبر من أن توصف بكلمات. اليوم، يشهد العالم اختراقاً مهماً في مجال آخر هو معالجة اللغة الطبيعية (NLP)، وهو تطور قد يكون حديث العهد، لكن رائد الأعمال ونائب رئيس شركة تويتر الأسبق، إيلاد جيل، يرى أن تأثيراته على البشر عموماً وعلى شركات التكنولوجيا خصوصاً قد تكون بالغة الأهمية في غضون 5 سنوات فقط.
المُحوِّلات وفهم اللغة
اللغة هي الطريقة التي يتواصل بها الناس مع بعضهم بعضاً، ويتشاركون من خلالها أفكارهم ومشاعرهم مع الآخرين ويبنون علاقات فيما بينهم. هناك ما يقرب من 6500 لغة منطوقة اليوم في العالم، وكل منها فريدة من نوعها. لكن هذا بالنسبة للبشر، فماذا عن الآلات؟
على الرغم من التطور السريع للبرمجيات، ظلت قدرة الحواسيب على التعامل مع اللغة محدودة. كانت البرمجيات رائعة في البحث عن التطابقات التامة في النصوص، لكنها غالباً ما كانت تفشل في الاستخدامات الأكثر تقدماً للغة، مثل تلك التي يقوم بها البشر يومياً. ومن هنا نشأت الحاجة إلى أدوات أكثر ذكاءً لفهم اللغة بشكل أفضل. وهو ما حدث في عام 2017، عندما وصف 8 من الباحثين في جوجل ما أطلقوا عليه اسم المُحوِّل (Transformer).
قبل الحديث عن تأثيرها، ربما يجب في البداية أن نطرح السؤال المهم: ما هو نموذج المُحوِّلات أو -بشكل أسهل- المُحوِّل؟ بحسب تعريف الهيئة السعودية للبيانات والذكاء الاصطناعي (سدايا)، فإن المُحوِّل هو بُنية شبكة عصبونية لمعالجة البيانات المتسلسلة بالاعتماد على آلية الانتباه الذاتي. ويُطلق عليها أيضاً اسم "شبكة المُحوِّلات العصبونية". يتم استخدامه بشكل أساسي في مجالي معالجة اللغة الطبيعية (NLP) والرؤية الحاسوبية (CV). ولمزيد من الإيضاح، فإن آلية الانتباه (Attention Mechanism) هي أسلوب في الشبكة العصبونية يُتيح للشبكة التركيز على جانب واحد من المدخلات المعقدة في كل مرة حتى تُصنَّف مجموعة البيانات بأكملها.
وقد ورد أول ذكر للمُحوِّلات في الورقة البحثية التي أصدرتها جوجل عام 2017، لكنها سرعان ما تحولت إلى إحدى أحدث وأقوى فئات النماذج التي تم اختراعها حتى الآن، لدرجة أن باحثي جامعة ستانفورد أطلقوا عليها العام الماضي اسم "نماذج الأساس" (Foundation Models).
اقرأ أيضاً: معهد الابتكار التكنولوجي يطلق “نور”: نموذج الذكاء الاصطناعي القادر على معالجة اللغة العربية
الانتقال من النظرية إلى التطبيق
يقول إيلاد جيل في تدوينة نشرها على مدونته الشخصية بموقع صب ستاك (Substack)، تحت عنوان "ثورة الذكاء الاصطناعي - المُحوِّلات والنماذج اللغوية الكبيرة"، إن ظهور نماذج المُحوِّلات في عام 2017 لمعالجة اللغة الطبيعية كان أحد أكبر الإنجازات التي حدثت في الآونة الأخيرة. وأضاف أنه على الرغم من اختراع المُحوِّلات في جوجل، فإن اعتمادها وتنفيذها تم سريعاً بواسطة شركة أوبن إيه آي (OpenAI) التي أنشأت النموذج اللغوي جي بي تي-1 (GPT-1) وطوّرته مرتين حتى وصلنا حالياً إلى جي بي تي-3 (GPT-3). وقد تتبعت شركات ومجموعات مصادر مفتوحة أخرى هذا النهج لتبني نماذج مُحوِّلات، مثلما فعلت شركات كوهير (Cohere) وإيه آي 21 (AI21) وإيلوثر (Eleuther)، أو لتطور ابتكارات في مجالات مثل معالجة الصوت والصورة، مثل تطبيقات دال-إي (Dall-E) وميدجيرني (MidJourney) وستابل ديفيوجن (Stable Diffusion) وغيرها.
ويشير "جيل" هنا إلى ملاحظة مهمة: أنه من بين الباحثين الثمانية المذكورة أسماؤهم في دراسة عام 2017، أسس 6 منهم شركات (4 منها مرتبطة بالذكاء الاصطناعي وواحدة خاصة ببروتوكول تشفير).
اقرأ أيضاً: أوبن أيه آي تطرح مليون نسخة من نموذجها اللغوي دال إي في الأسواق
ويرى "جيل"، الذي يعمل أيضاً مستثمراً ومستشاراً للعديد من شركات التكنولوجيا والشركات الناشئة، أن تطبيقات المُحوِّلات، ومعالجة اللغة الطبيعية بشكل عام، لا تزال ناشئة لكنها من المرجح أن تكون حاسمة على مدى السنوات الخمس المقبلة. ويتابع: "جزء كبير من عالم المؤسسات يدور بالفعل حول اللغة، فالعقود القانونية والتعليمات البرمجية والفواتير والمدفوعات والبريد الإلكتروني ومتابعة المبيعات، تُعد كلها صوراً من اللغة. إن قدرة آلة على تفسير المعلومات الموجودة في المستندات بشكل محكم، واتخاذ إجراءات بناءً عليها ستكون واحدة من أكثر التحولات الجذرية منذ الأجهزة المحمولة أو السحابة".
النماذج اللغوية الكبيرة على نهج الأجهزة المحمولة
ساهمت النماذج اللغوية الكبيرة (LLMs) اليوم في ظهور تطبيقات مثل جيت هاب كوبايلوت (GitHub Copilot) الذي يساعد المبرمجين على كتابة التعليمات البرمجية، أو أدوات مبيعات وتسويق مثل جاسبر (Jasper) أو كوبي أيه آي (Copy.AI).
يقارن "جيل" بين التأثير المستقبلي المتوقع لهذه النماذج اللغوية الكبيرة، بالتأثير الذي أحدثته ثورة الأجهزة المحمولة في شكل وطبيعة عمل الشركات بحلول عام 2010. ويتوقع أن ينتهي المطاف بظهور 3 أنواع من الشركات:
- منصات وشركات بنية تحتية: أدت الهواتف المحمولة في النهاية إلى ظهور منصتي "آي أو إس" و"أندرويد". وبالمثل، قد تؤدي النماذج اللغوية الكبيرة إلى بروز شركات مثل "أوبن أيه آي" وجوجل وكوهير، أو شركات مرتبطة بها متخصصة في بناء النماذج اللغوية الأساسية الكبيرة. كما أن هناك شركات بُنى تحتية، مثل هاغينغ فيس (Hugging Face)، تطور أشياء مثيرة للاهتمام.
- شركات قائمة بذاتها: يقصد "جيل" هنا ظهور تطبيقات جديدة مبنية فوق المنصات المدرجة ضمن النوع الأول. فكما ظهرت أنواع جديدة من الشركات والتطبيقات مثل إنستغرام وأوبر، لم تكن لتوجد دون التطورات التي حدثت للأجهزة المحمولة ونظام تحديد المواقع العالمي (GPS) والكاميرات وغيرها، ستدفع المُحوِّلات أيضاً إلى ظهور شركات مثل "جاسبر" و"كوبي أيه آي"، لم تكن لتوجد دون تحقيق إنجازات مهمة في مجال التعلم الآلي.
- شركات عملاقة ممكّنة تقنياً: يشير "جيل" هنا إلى أن الشركات الكبرى قد لا يتوجب عليها سوى إضافة الذكاء الاصطناعي إلى منتجاتها الموجودة بالفعل، بينما تعاني الشركات الناشئة للبدء من الصفر. ويوضح أنه خلال ثورة الأجهزة المحمولة، استحوذت الشركات الكبرى على الجزء الأكبر من الفائدة. على سبيل المثال، بينما حاولت العديد من الشركات الناشئة إنشاء أدوات محمولة لإدارة علاقات العملاء (mobile CRM)، فإن الشركات التي فازت هي شركات إدارة علاقات العملاء الحالية التي طوّرت تطبيقات هاتفية. فلم يتم استبدال شركة سيلز فورس (Salesforce) المتخصصة في خدمات إدارة علاقات العملاء بواسطة الأجهزة المحمولة، وإنما أنشأت هي بنفسها تطبيقاً للهواتف المحمولة. وبالمثل، لم يتم استبدال أدوات مثل جيميل (Gmail) ومايكروسوفت أوفيس (Microsoft Office) بواسطة الأجهزة المحمولة، وإنما طورت الشركتان تطبيقات للهواتف.
اقرأ أيضاً: ما هي أهم ميزة أغفلها الضجيج الإعلامي بشأن نموذج الذكاء الاصطناعي الجديد من ديب مايند؟
في نهاية المطاف، سيتم دمج التعلم الآلي في العديد من المنتجات الأساسية الموجودة اليوم، دون حاجة لاستبدالها نهائياً. بمعنى أن فرصة شركة سيلز فورس لامتلاك أدوات ذكية لإدارة علاقات العملاء ستكون أكبر من فرصة ظهور أدوات جديدة تماماً لتحل محل الشركة، نتيجة لتطور التعلم الآلي. ولكن بالطبع هناك فرصة دائماً أن تظهر نسخة جديدة من هذه المنتجات مدعومة بالتعلم الآلي، تكون أفضل بشكل كبير من الشركات القائمة، لدرجة تجعل شركة ناشئة تطيح بشركة كبرى موجودة حالياً.