في فبراير/ شباط، أطلقت شركة ميتا (Meta) نموذجها اللغوي الكبير: لاما (LLaMA). وعلى عكس أوبن أيه آي (OpenAI)، عند إطلاقها لنموذجها اللغوي تشات جي بي تي (ChatGPT)، لم تكتفِ ميتا بتقديم برنامج بنافذة دردشة يمكن لأي شخص في العالم أن يتسلى به. بدلاً من ذلك، نشرت الرموز البرمجية في أوساط المصادر المفتوحة، التي شهدت تسريب النموذج نفسه إليها لاحقاً. بدأ الباحثون والمبرمجون على الفور بتعديل النموذج، وتحسينه، ودفعه إلى تنفيذ أشياء لم يكن لأي شخص آخر أن يتوقعها، وحصلوا على نتائج فورية ومبتكرة، وتشير هذه النتائج إلى طبيعة مستقبل التكنولوجيا. تضاعفت سرعات التدريب بدرجة كبيرة، وتقلصت أحجام النماذج نفسها إلى مرحلة أصبح فيها من الممكن بناؤها وتشغيلها على حاسوب محمول. شهد عالم أبحاث الذكاء الاصطناعي تغيرات كبيرة.
كيف ستؤدي إتاحة الرموز البرمجية مفتوحة المصدر إلى انتزاع هيمنة شركات التكنولوجيا الكبرى؟
ومع أن هذا التطور لم يؤدِّ إلى ضجة إعلامية مكافئة لغيره من إعلانات الشركات الأخرى، فإن نتائجه ستكون أكثر عمقاً وأبعد مدى. سيؤدي هذا الأمر إلى انتزاع النفوذ من يد الشركات التكنولوجية الكبرى، ما يعني زيادة كبيرة في الابتكار، ومزيداً من التعقيد في المشهد القانوني. حذّرت الشركات الكبرى التي كانت تتحكم في هذه النماذج من أن هذا الأسلوب المفتوح والمجاني والمتاح للجميع في العمل قد يؤدي إلى عواقب خطِرة، وقد جرى بالفعل توثيق العديد من الاستخدامات الإشكالية للتكنولوجيا المفتوحة. لكن الذين يعملون على النماذج المفتوحة يردون قائلين إن بيئة العمل البحثي المتاحة على نطاق أوسع أفضل من بقاء هذه التكنولوجيا العالية القدرة تحت سيطرة مجموعة صغيرة من الشركات.
ينتج هذا الانتقال في النفوذ عن طريق التبسيط؛ فالنماذج اللغوية الكبيرة التي بنتها أوبن أيه آي وجوجل تعتمد على مجموعات بيانات هائلة يصل حجمها إلى عشرات المليارات من الوحدات المقدّرة بالبايت، وتُجرى حساباتها باستخدام عشرات الآلاف من المعالجات الخاصة العالية القدرة التي تنتج النماذج بمليارات المُعامِلات الوسيطة. باختصار، يحتاج بناء نموذج أفضل إلى بيانات أكثر، وقدرات معالجة أعلى، ومجموعات أضخم من المعاملات. يتطلب إنتاج هذه النماذج موارد شركة تمتلك الكثير من الأموال وتجهيزات الحوسبة، مثل جوجل أو مايكروسوفت أو ميتا.
اقرأ أيضاً: لماذا لا يمكن للنموذج اللغوي لامدا أن يمتلك وعي البشر كما قال مهندس في جوجل؟
تجربة النموذج لاما من ميتا
ولكن البناء على أساس النماذج المفتوحة للجميع، مثل لاما من ميتا، أتاح لأوساط المصادر المفتوحة تصميم ابتكارات جديدة تتيح الحصول على نتائج تكاد تقارب نتائج النماذج الضخمة، ولكن باستخدام حواسيب منزلية مع مجموعات بيانات شائعة. وهكذا، تحول هذا المجال الذي كان يقتصر على الشركات الغنية بالموارد إلى ملعب مفتوح أمام أي شخص يمتلك ما يكفي من الفضول ومهارات البرمجة، إضافة إلى حاسوب محمول جيد. قد تكون النماذج الضخمة هي الأفضل، ولكن أوساط المصادر المفتوحة أثبتت أن النماذج الأصغر جيدة بما يكفي في أغلب الأحيان. وهو ما يفتح المجال أمام نماذج لغوية كبيرة تتميز بفعالية أكبر وسهولة أكبر في الوصول إليها، ومتطلبات أقل من الموارد.
أما الأهم من هذا، فهو أن هذه النماذج اللغوية الصغيرة الأصغر والأسرع تتيح الوصول إليها وإجراء التجارب عليها بسهولة أكبر. وبدلاً من الحاجة إلى عشرات الآلاف من الآلات والملايين من الدولارات لتدريب نموذج جديد، أصبح من الممكن الآن تعديل نموذج موجود مسبّقاً باستخدام حاسوب محمول متوسط السعر خلال بضع ساعات، وهو ما يعني دعم الابتكار وتسريعه.
ويعني أيضاً انتزاع النفوذ من الشركات الكبرى مثل جوجل وأوبن أيه آي. يمكن لمبادرات المصادر المفتوحة أن تعزز عمل نطاق واسع من المطورين والباحثين والمؤسسات لبلورة هذه التكنولوجيا، وذلك بإتاحة الوصول إلى الرموز البرمجية الأساسية وتشجيع التعاون. يمكن لهذا التنويع في الجهات التي تتحكم في هذه التكنولوجيا أن يساعد على منع التأثير المبالغ فيه، وضمان توافق تطوير تكنولوجيات الذكاء الاصطناعي وتطبيقها مع نطاق أوسع من القيم والأولويات. بُنيت أجزاء كبيرة من شبكة الإنترنت المعاصرة بالاعتماد على تكنولوجيات مفتوحة المصدر من مجموعة لامب (LAMP) (أي لينوكس (Linux) وأباتشي (Apache) وماي إس كيو إل (mySQL) وكل من لغات البرمجة بي إتش بي/ بيرل/ بايثون (PHP/PERL/Python))، وهي مجموعة من التطبيقات المستخدمة على نطاق واسع في تطوير الويب. أتاح هذا إنشاء مواقع الويب المتطورة بسهولة، وذلك باستخدام أدوات مفتوحة المصدر من تصميم المهتمين المتحمسين، لا الشركات التي تسعى لتحقيق الأرباح. ومن الجدير بالذكر أن موقع فيسبوك نفسه بُنِي في البداية بالاعتماد على لغة بي إتش بي.
اقرأ أيضاً: كيف يمكن أن يساعد الذكاء الاصطناعي في تحقيق المصلحة العامة؟
سلبيات المصادر المفتوحة
لكن المصادر المفتوحة تعني أيضاً عدم وجود جهة محددة تتحمل المسؤولية عن إساءة استخدام التكنولوجيا. وعند اكتشاف الثغرات في بعض الأجزاء الخفية في التكنولوجيا المفتوحة المصدر والجوهرية في عمل الإنترنت، فلا يوجد في أغلب الأحيان أي جهة مسؤولة عن إصلاح هذه الثغرات. تمتد مجتمعات المصادر المفتوحة عبر عدة بلدان وثقافات، ما يجعل من الصعب ضمان احترامها لقوانين أي بلد في العالم. وبما أن التكنولوجيا مفتوحة المصدر، فهذا يعني أن الراغبين باستخدامها لغايات غير مقصودة، أو غير قانونية، أو خبيثة، قادرون على الوصول إليها شأنهم شأن الجميع.
وهذا ما يؤدي بدوره إلى نتائج مؤثرة بالنسبة لمن يسعون إلى تنظيم هذه التكنولوجيا الجديدة والفائقة القدرة. وبما أن مجتمعات المصادر المفتوحة تعمل على تعديل النماذج اللغوية الكبيرة، فقد أصبح من المستحيل تنظيم هذه التكنولوجيا بتحديد مجالات البحث والتطوير المسموح بها، فثمة عدد كبير من الباحثين الذين يعملون على مشاريع مختلفة في الكثير من البلدان. وفي الوقت الحالي، لا توجد آلية لإدارة هذه التكنولوجيا لدى الحكومات سوى تنظيم الاستخدام (وفقط بالنسبة لمن يراعون القوانين)، أو تقديم الحوافز للجهات التي تقود الابتكار في هذا المجال، بما في ذلك بعض الشركات الناشئة والصغيرة وبعض الأفراد. ويمكن أن تأخذ الحوافز المقدمة إلى تلك المجتمعات شكل جوائز لابتكار استخدامات معينة لهذه التكنولوجيا، أو مسابقات برمجية (مثل ماراثون البرمجة) لتطوير استخدامات مفيدة على وجه الخصوص. يصعب استخدام العصا في هذه المسألة، ولهذا، فنحن بحاجة إلى جزرة جذابة.
اقرأ أيضاً: مهندسون جدد لشبكة الويب العالمية: هل انتهى عصر شريط البحث؟
قد لا تكون الأرباح هي محرك التطوير
يجب أن نتذكر أن الأرباح ليست الحافز الوحيد لمجتمعات المصادر المفتوحة، فأفراد هذه المجتمعات يعملون في أغلب الأحيان بدافع من الفضول، والرغبة في التجربة، أو ببساطة، متعة البناء والتصميم. وعلى الرغم من وجود شركات تجني الأرباح من دعم البرمجيات التي تنتجها المشاريع المفتوحة المصدر مثل لينوكس وبايثون وخادم الويب أباتشي، فإن تلك المجتمعات نفسها لا تعمل بدافع جني الأرباح.
إضافة إلى هذا، ثمة العديد من النماذج المفتوحة المصدر التي يمكن الاختيار من بينها. فقد شهدت الأشهر القليلة الماضية إطلاق العديد من هذه النماذج، مثل ألباكا (Alpaca) وسيريبراس جي بي تي (Cerebras-GPT) ودولي (Dolly) وهاغنينغ تشات (HuggingChat) وستيبل إل إم (StableLM). بُنِيت معظم هذه النماذج على أساس لاما، ولكن بعضها مبني على أساس نماذج أخرى، وستظهر نماذج أخرى لاحقاً.
لقد كانت الشركات الكبرى، مثل جوجل ومايكروسوفت وميتا، تحتكر تطوير النماذج اللغوية الكبيرة وتطبيقها، وليست مستعدة لهذه التغيرات الجديدة. فمنذ فترة وجيزة، سرّب أحد موظفي جوجل مذكرة حاول فيها أحد المهندسين أن يشرح لرؤسائه تأثيرات النماذج اللغوية الكبيرة المفتوحة المصدر على التكنولوجيات الخاصة بالشركة، وخلصت المذكرة إلى أن مجتمعات المصادر المفتوحة تمكنت من تجاوز الشركات الكبيرة، والتقدم عليها بمراحل عديدة.
ليست هذه المرة الأولى التي تتجاهل فيها الشركات قدرات مجتمعات المصادر المفتوحة، فشركة صن (Sun) لم تدرك يوماً قدرات لينوكس، وهذا ينطبق أيضاً على شركة نتسكيب (Netscape) التي أساءت فهم خادم الويب أباتشي. ومع أن مجتمعات المصادر المفتوحة ليست بارعة في مجال الابتكارات الجديدة، فإنها قادرة على تحقيق إنجازات كبيرة بمجرد ظهور الابتكارات واستيعاب قدراتها. قد ترد الشركات الكبرى بمحاولة عزل نفسها وسحب نماذجها من مجتمعات المصادر المفتوحة.
اقرأ أيضاً: هل ينقذ الذكاء الاصطناعي اللغات المهددة بالانقراض؟
ولكن الأوان قد فات. لقد دخلنا حقبة الانتشار الواسع والمفتوح للنماذج اللغوية الكبيرة. وبإثبات الفعالية العالية للنماذج الأصغر، وسهولة إجراء التجارب عليها، وتنويع الأطراف المؤثرة في هذا المجال، وتقديم الحوافز التي لا تعتمد على الأرباح، ستنقلنا مبادرات المصادر المفتوحة إلى مشهد أكثر حيوية وشمولية في الذكاء الاصطناعي. ولكن هذا لا يعني أن هذه النماذج خالية من التحيز والأخطاء تماماً، وأنها لن تُستَخدم في تزييف الحقائق والإساءة، ولكنه يعني أن التحكم في هذه التكنولوجيا سيتخذ نهجاً مختلفاً تماماً عن تنظيم الشركات الكبيرة.