كيف يمكن تحسين تعلم الذكاء الاصطناعي للغات بالاعتماد على إدراك الأطفال؟

4 دقيقة
كيف يمكن تحسين تعلم الذكاء الاصطناعي للغات بالاعتماد على إدراك الأطفال؟
حقوق الصورة: shutterstock.com/kung_tom

يتفوق الأطفال البشر بفارق كبير حتى على أفضل النماذج اللغوية الكبيرة من حيث القدرة على التعلم. فقد احتاج تشات جي بي تي (ChatGPT) إلى التدرب على مجموعات بيانات هائلة تحتوي عدداً هائلاً من الكلمات يبلغ الملايين؛ بل وربما يصل إلى التريليون، وذلك حتى يتمكن من الكتابة بصياغة مقبولة باللغة الإنجليزية. من ناحية أخرى، يعتمد الأطفال على نسبة صغيرة للغاية من هذه البيانات؛ غير أنهم يتواصلون بطرائق معقدة للغاية في سن الثالثة.

هل يستطيع الذكاء الاصطناعي أن يتعلم مثل طفل؟

ولهذا؛ طرح فريق من الباحثين في جامعة نيويورك السؤال التالي: هل يستطيع الذكاء الاصطناعي أن يتعلم مثل طفل؟ ماذا يستطيع نموذج ذكاء اصطناعي أن يفعل عند تلقيمه بمجموعة بيانات أصغر بكثير، وتتألف من المشاهدات والأصوات التي يختبرها طفل واحد يتعلم الكلام؟

تبين للباحثين أنه يمكن فعل الكثير بهذه البيانات.  فقد تمكن نموذج الذكاء الاصطناعي من مطابقة الكلمات مع الأشياء التي تمثلها.  يقول عالم الإدراك الحاسوبي في جامعة نيويورك وأحد مؤلفي الدراسة، بريندن ليك: "ثمة ما يكفي من البيانات حتى في هذا الجزء الصغير من تجارب الطفل لتعلم الكلمات بصورة عملية". نُشِر هذا العمل مؤخراً في مجلة ساينس (Science)، ولا يقدم معلومات حول أسلوب الأطفال في التعلم وحسب؛ بل يمكن أن يؤدي أيضاً إلى تحسين نماذج الذكاء الاصطناعي.

في هذه التجربة، اعتمد الباحثون على 61 ساعة من مقاطع الفيديو التي صُوِّرَت باستخدام خوذة مزودة بكاميرا يرتديها طفل يعيش قرب مدينة أديليد في أستراليا. ارتدى الطفل سام الكاميرا على نحو متقطع مدة سنة ونصف السنة، منذ أن كان عمره 6 أشهر إلى ما بعد عيد ميلاده الثاني بقليل. صورت الكاميرا الأشياء التي كان سام ينظر إليها ويركز انتباهه عليها خلال فترات بلغت نسبتها 1% من ساعات يقظته. حيث سجلت لقطات لقِطّتي سام ووالديه ومهده وألعابه ومنزله ووجباته، وغير ذلك. يقول ليك: "كانت هذه البيانات فريدة من نوعها، وهي أفضل وسيلة توصّلنا إليها للاطلاع على وجهة نظر طفل واحد".

اقرأ أيضاً: ما الدروس التي يمكن تعلمها من استخدام خان أكاديمي لتشات جي بي تي في التعليم؟

ربط الكلمات المنطوقة بالأشياء

استخدم ليك وزملاؤه لتدريب النموذج 600,000 لقطة فيديو مقترنه بجمل نطقها والدا سام أو غيرهما من الأشخاص في الغرفة عند التقاط الصورة؛ أي ما يصل إجمالاً إلى 37,500 "عبارة ملفوظة". كانت الكلمات متوافقة مع الأشياء في بعض الأحيان، وكانت غير متوافقة معها في أحيان أخرى. على سبيل المثال؛ ينظر سام في إحدى اللقطات إلى لعبة ترتيب الأشكال ويقول أحد والديه: "أنت تحب الخيط". وفي لقطة أخرى، تغطي يد شخص بالغ بعض الكتل ويقول أحد الوالدين: "أنت تريد الكتل أيضاً".

مصدر الصورة: تقدمة من والد سام

قدم الفريق إشارتين إلى النموذج، فعندما يتزامن ورود أشياء وكلمات معينة معاً، يمثل هذا دليلاً على احتمال وجود ترابط بين هذه الأشياء وتلك الكلمات. غير أنه عندما لا يتزامن ورود شيء مع كلمة معينة، فهذا يمثل دليلاً على عدم وجود رابط بينهما على الأرجح. يقول عالِم الإدراك الحاسوبي في جامعة نيويورك وأحد مؤلفي الدراسة، واي كين فونغ: "لدينا ما يشبه التجاذب والتنافر ضمن النموذج. ولدينا أمل بأن البيانات تتضمن ما يكفي من الأمثلة لحسم وجود ارتباط بين كلمة ’كرة‘ ورؤية الطفل للكرة".

قد تبدو عملية مطابقة الكلمات مع الأشياء التي تمثلها مهمة بسيطة، لكنها ليست كذلك. وكي نستوعب نطاق المشكلة، يمكن أن نتخيل غرفة الجلوس لعائلة لديها بعض الأطفال الصغار. تحتوي غرفة الجلوس مختلفَ أنواع الأثاث المعتاد؛ لكنها تعج أيضاً بفوضى الأطفال، فالأرض مليئة بالألعاب، وأقلام التلوين مبعثرة على طاولة تتوسط الغرفة، وثمة كوب وجبة خفيفة على حافة النافذة، وبعض الغسيل على كرسي. فإذا سمع الطفل كلمة "كرة"، قد تشير هذه الكلمة إلى كرة؛ لكنها قد تشير أيضاً إلى أي لعبة أخرى، أو إلى الأريكة، أو إلى سروال، أو إلى شكل شيء معين أو لونه، أو وقت ما خلال النهار. يقول ليك: "ثمة عدد لا نهائي من المعاني المحتملة لأي كلمة".

هذه المعضلة معقدة للغاية، إلى درجة دفعت ببعض المتخصصين بعلم نفس النمو إلى الاعتقاد أن الأطفال يولدون مزودين بقدرة فطرية على فهم آليات اللغة بحيث يتمكنون من تعلمها بهذه السرعة.  لكن هذه الدراسة تشير إلى أن بعض أجزاء اللغة قابلة للتعلم بالاعتماد على مجموعة صغيرة للغاية من التجارب حتى في غياب هذه القدرة الفطرية كما تقول المتخصصة بعلم نفس النمو في جامعة سكيدمور، جيس سوليفان؛ التي كانت جزءاً من الفريق الذي جمع بيانات كاميرا الخوذة من سام لكنها لم تشارك في الدراسة الجديدة. وتقول: "أدى هذا العمل إلى إحداث تغيير جذري في نظرتي إلى العالم".

اقرأ أيضاً: أوبن أيه آي تبحث صنع رقائقها الخاصة وذكاء «سناب شات» الاصطناعي يُعرّض خصوصية الأطفال للخطر

الأطفال ينتجون مجموعة بيانات تتعلم منها الشبكات العصبونية

غير أن سوليفان تشير إلى أن المطابقة بين الكلمات والأشياء التي تمثلها، على الرغم من أنها مشكلة صعبة التعلم؛ ليست سوى جزء من اللغة وحسب. ثمة قواعد تنظم كيفية ترابط الكلمات معاً، فقد يعرف الكلب الأليف معنى كلمة "كرة" أو "نزهة"؛ لكن هذا لا يعني أنه يفهم اللغة الإنجليزية. ومن المحتمل أن القدرات اللغوية الفطرية لدى الأطفال، مهما تكن، تتجاوز مسألة المفردات وحسب، فقد تؤثر في كيفية تحركهم ضمن العالم، أو تحديد ما ينتبهون إليه، أو كيفية استجابتهم إلى اللغة. تقول سوليفان: "لا أعتقد أن الدراسة كانت ستنجح لو لم ينتج الأطفال مجموعة البيانات التي كانت الشبكة العصبونية تتعلم منها".

طفلة ترتدي كاميرا على رأسها وتجلس على كرسي مرتفع

مصدر الصورة: بريندن ليك

في إطار الخطوة التالية، سيحاول ليك وزملاؤه تحديد العوامل المطلوبة التي تتيح للنموذج محاكاة المراحل الأولى من تعلم اللغات عند الأطفال بصورة أدق. ويقول: "ثمة المزيد مما يجب فعله للتوصل إلى نموذج يحاكي القدرات الكاملة لطفل يبلغ سنتين من العمر"، وقد يعني هذا جمع المزيد من البيانات. قرر ليك إشراك طفلته التي يبلغ عمرها 18 شهراً، في المجموعة التالية من الأطفال الذين ينتجون هذه البيانات. ترتدي طفلته خوذة الكاميرا بضع ساعات أسبوعياً. من المحتمل أيضاً أن النموذج يحتاج إلى أخذ نظرة الوالدين بعين الاعتبار، أو الحصول على معلومة ما حول صلابة الأشياء التي يمسكها الأطفال غريزياً. يمكن أن يساعد بناء نماذج قادرة على محاكاة التعلم عند الأطفال على تحسين فهم التعلم والنمو عند البشر.

اقرأ أيضاً: 6 أفكار حول الذكاء الاصطناعي يجب أن نناقشها الآن مع الأطفال

ومن المحتمل أن تكون نماذج الذكاء الاصطناعي القادرة على محاكاة بعض أساليب البشر في تعلم اللغات أكثر فاعلية في التعلم؛ حيث ستسلك سلوكاً أقرب إلى البشر وأبعد عن "محرك إحصائي بطيء يركز على مطابقة الأنماط" وفقاً للتوصيف الذي أطلقه اللغوي نعوم تشومسكي وزملاؤه ذات مرة على النماذج اللغوية الكبيرة مثل تشات جي بي تي. يقول مدير البرنامج في وكالة مشاريع البحوث الدفاعية المتقدمة التابعة لوزارة الدفاع الأميركية، هاورد شروب؛ الذي ساعد على تمويل فريق ليك: "ما زالت أنظمة الذكاء الاصطناعي تفتقر إلى التماسك والمنطق السليم". غير أن الذكاء الاصطناعي القادر على التعلم مثل الأطفال قد يتمكن من فهم المعاني، والاستجابة إلى المواقف الجديدة، والتعلم من التجارب الجديدة. ويهدف هذا العمل في المحصلة إلى تقريب الذكاء الاصطناعي من الذكاء الطبيعي.

المحتوى محمي