تولى أندرو إنج العديد من الوظائف على مدار حياته. ربما تعرفه كمؤسس لفريق جوجل برين (Google Brain) أو باعتباره كبير العلماء السابق في شركة بايدو. وربما تعرفه أيضاً باعتباره معلمك الخاص، فقد علّم عدداً لا يحصى من الطلاب والمستمعين الفضوليين وقادة الأعمال مبادئَ التعلم الآلي، من خلال دوراته التدريبية التي يلقيها عبر الإنترنت والتي تحظى بشعبية كبيرة.
والآن في أحدث مشروعاته، المُسمى لاندينج إيه آي (Landing AI)، والذي بدأه عام 2017، يستكشف إنج كيف يمكن للشركات التي لا تملك مجموعات بيانات عملاقة -يمكن الاستفادة منها- أن تلحق بركاب ثورة الذكاء الاصطناعي.
في 23 مارس الجاري، شارك إنج في مؤتمر إيمتيك ديجتال (EmTech Digital) الافتراضي -وهو المؤتمر السنوي الذي تنظمه إم آي تي تكنولوجي ريفيو حول الذكاء الاصطناعي- لتبادل الدروس التي تعلمها.
تم اختصار وتحرير هذه المقابلة بشكل طفيف لأغراض الوضوح.
إم آي تي تكنولوجي ريفيو: أنا متأكد أن الناس يسألونك باستمرار: "كيف يمكنني تأسيس شركة موجهة بالذكاء الاصطناعي؟" فكيف تجيب عادة عن هذا السؤال؟
أندرو إنج: عادة ما أقول "لا تفعل ذلك". إذا توجهت إلى أحد الفرق وقلت لهم: "انتبهوا جميعاً، أرجو أن نضع الذكاء الاصطناعي في المقام الأول"، فإن هذا يجعل الفريق ينحو إلى التركيز على التكنولوجيا، وهو الأمر الذي قد يكون رائعاً بالنسبة لمختبر أبحاث، ولكن فيما يتعلق بكيفية إنجاز الأعمال، فإنني أميل إلى التركيز على العميل أو التركيز على الرسالة، ولا أميل أبداً في الغالب إلى التركيز على التكنولوجيا.
لديك الآن هذا المشروع الجديد المُسمى لاندينج إيه آي. هل يمكنك أن تحدثنا قليلاً عن ماهيته، ولماذا اخترت العمل عليه؟
بعد أن ترأست فرق الذكاء الاصطناعي في كلٍ من جوجل وبايدو، أدركت أن الذكاء الاصطناعي قد حوّل البرمجيات الاستهلاكية القائمة على الإنترنت، مثل البحث عبر الويب والإعلان الإلكتروني. لكني أردت أن أُدخل الذكاء الاصطناعي إلى جميع الصناعات الأخرى، التي تمثل جزءاً أكبر من الاقتصاد. لذلك، وبعد البحث في الكثير من الصناعات المختلفة، قررت التركيز على التصنيع. أعتقد أن العديد من الصناعات جاهزة للذكاء الاصطناعي، لكن النمط الصناعي يكون أكثر جاهزية لهذا الأمر إذا خضع لبعض التحول الرقمي، بحيث تكون هناك بعض البيانات. وهذا الأمر يتيح الفرصة لفرق الذكاء الاصطناعي للتدخل واستخدام تلك البيانات لخلق قيمة.
لذا، فإن أحد المشروعات التي أثارت اهتمامي في الآونة الأخيرة هو مشروع "الفحص البصري للإنتاج الصناعي". هل يمكنك إلقاء نظرة على صورة هاتف ذكي يخرج من أحد خطوط التصنيع لمعرفة ما إذا كان هناك عيب فيه؟ أو النظر إلى إحدى قطع غيار السيارات ومعرفة ما إذا كان هناك انبعاج فيها؟ أحد الاختلافات الهامة في خدمات الإنترنت البرمجية الاستهلاكية أنه قد يكون لديك مليار مستخدم وكمية هائلة من البيانات، ولكن في مجال التصنيع لم ينتج أي مصنع مليار ولا حتى مليون هاتف ذكي مخدوش. والحمد لله على ذلك. لذا فإن التحدي يكمن في: هل يمكنك جعل الذكاء الاصطناعي يعمل بمائة صورة فقط؟ في كثير من الأحيان يتبين أنك تستطيع فعل ذلك. في الواقع، لقد فوجئت في الكثير من المرات بمدى ما يمكنك عمله حتى بكميات متواضعة من البيانات. وهكذا على الرغم من كل الضجيج والحماس وأنشطة العلاقات العامة حول اعتماد الذكاء الاصطناعي على مجموعات البيانات العملاقة، أشعر أن هناك حيزاً واسعاً نحتاجه لنتمكن من النمو واقتحام هذه التطبيقات الأخرى التي تكون التحديات فيها مختلفة تماماً.
كيف تفعل ذلك؟
ثمة خطأ يتكرر كثيراً، أرى أن الرؤساء التنفيذيين وكبار مسؤولي شؤون المعلومات يرتكبونه: يقولون لي شيئاً على غرار "مرحباً أندرو، ليس لدي هذا الكم الكبير من البيانات وبياناتي في حالة يرثى لها. لذا أمهلني عامين لكي أبني بنية تحتية كبيرة لتكنولوجيا المعلومات. ثم سيكون لدينا كل هذه البيانات الكبيرة التي يمكن أن نبني عليها الذكاء الاصطناعي". ودائماً ما أقول إن "هذا خطأ. لا تفعل ذلك". أولاً، لا أظن أن أي شركة على هذا الكوكب حالياً -ربما ولا حتى شركات التكنولوجيا العملاقة- تعتقد أن بياناتها صحيحة وسليمة تماماً. الأمر عبارة عن رحلة، وقضاء عامين أو ثلاثة أعوام في بناء بنية تحتية جميلة للبيانات يعني أن هناك نقصاً في الملاحظات التي يبديها فريق الذكاء الاصطناعي لمساعدتك على تحديد أولويات البنية التحتية لتكنولوجيا المعلومات التي يجب بناؤها.
على سبيل المثال، إذا كان لديك الكثير من المستخدمين، فهل ينبغي أن تعطي الأولوية لطرح الأسئلة عليهم في استطلاع للحصول على القليل من البيانات الإضافية؟ أو إذا كان لديك مصنع، هل يجب أن تعطي الأولوية لتحديث جهاز الاستشعار من شيء يسجل الاهتزازات بمعدل 10 مرات في الثانية إلى 100 مرة في الثانية؟ غالباً ما يبدأ تنفيذ مشروع الذكاء الاصطناعي بالبيانات التي تمتلكها بالفعل، والتي تمكن فريق الذكاء الاصطناعي من تزويدك بالملاحظات اللازمة لمساعدتك على ترتيب أولويات البيانات الإضافية التي يتعين جمعها.
في مجال الصناعة، لا نملك نفس حجم البرمجيات الاستهلاكية القائمة على الإنترنت؛ لذا أشعر أننا في حاجة إلى تغيير طريقة تفكيرنا من البيانات الضخمة إلى البيانات الجيدة. إذا كان لديك مليون صورة، فامضِ قدماً واستخدمها. سيكون هذا أمراً رائعاً. ومع ذلك، فإن هناك الكثير من المشاكل التي يمكن أن تستخدم في حلها مجموعات أصغر بكثير من البيانات المصنفة بعناية والمختارة بدقة.
هل يمكن أن تعطينا مثالاً؟ ماذا الذي تقصده بالبيانات الجيدة؟
اسمح لي أولاً أن أعطي مثالاً مستمداً من أنظمة التعرف على الكلام. عندما كنت أعمل في مجال البحث الصوتي، كنا نستمع إلى مقاطع صوتية يقول فيها شخص ما: "اممم طقس اليوم". السؤال هو: ما هو التدوين الصحيح لهذا المقطع الصوتي؟ هل هو "اممم (فاصلة) طقس اليوم"، أم "اممم (نقطة، نقطة، نقطة) طقس اليوم"، أم أن "اممم" هي شيء لا ندونه؟ اتضح لنا أن أياً من هذه الخيارات سيكون جيداً، ولكن ما لن يكون جيداً هو إذا استخدم مدونون مختلفون علامات التصنيف الثلاث؛ إذ إن بياناتك ستصبح عندئذ مشوشة، وستضر بنظام التعرف على الكلام. في الوقت الحالي، عندما يكون لديك الملايين أو المليارات من المستخدمين، لا يتوجب عليك سوى أن تستخرج متوسط تلك البيانات المشوشة، وهنا ستفي خوارزمية التعلم بالغرض. أما إذا كنت في بيئة تمتلك فيها مجموعة بيانات أصغر حجماً -لنقل مثلاً مائة مثال- فإن هذا النوع من البيانات المشوشة يكون له تأثير كبير على الأداء.
لدينا مثال آخر مستمد من مجال التصنيع: لقد عملنا كثيراً في عمليات فحص الفولاذ. إذا كنت تقود سيارة، فيجب أن تعلم أن جانب سيارتك كان مصنوعاً يوماً ما من صفائح فولاذية. وفي بعض الأحيان توجد تجاعيد صغيرة في الفولاذ، أو خدوش أو بقع صغيرة عليه؛ لذا يمكنك استخدام الكاميرا وتقنية الرؤية الحاسوبية لمعرفة ما إذا كانت هناك عيوب أم لا. بيد أن برامج التصنيف المختلفة ستصنف البيانات بطرق مختلفة، فبعضها سيضع مربعاً محيطاً عملاقاً حول المنطقة بأكملها، بينما سيضع البعض الأخر مربعات صغيرة حول الجسيمات الصغيرة. وبالتالي، عندما يكون لديك مجموعة بيانات محدودة، تأكد من قيام مفتشي الجودة المختلفين بتصنيف البيانات بشكل متسق، فقد تبين أن هذا الأمر يمثل أحد أهم الأشياء.
بالنسبة للكثير من مشروعات الذكاء الاصطناعي، فإن النموذج مفتوح المصدر الذي تقوم بتنزيله من منصة جيت هاب (GitHub) -الشبكة العصبونية التي يمكنك الحصول عليها من المؤلفات- يكون جيداً بما يكفي. بالطبع ليس لحل جميع المشاكل، ولكن للمشاكل الرئيسية. لذلك كنت أقول للعديد من الفرق التي عملت معها إن "الشبكة العصبونية جيدة بما يكفي. فلنتوقف عن العبث بالتعليمات البرمجية مجدداً. الشيء الوحيد الذي ستقومون به الآن هو بناء عمليات لتحسين جودة البيانات". وقد اتضح أن هذا الأمر غالباً ما يؤدي إلى تحسينات أسرع في أداء الخوارزمية.
ما هو حجم البيانات الذي تفكر فيه عندما تقول مجموعات بيانات أصغر حجماً؟ هل تقصد مائة مثال؟ أو عشرة أمثلة؟
يتسم التعلم الآلي بالتنوع الشديد لدرجة أنه أصبح من الصعب حقاً تقديم إجابات موحدة تناسب الجميع. لقد عملت على حل مشاكل كان لدي فيها ما بين 200 إلى 300 مليون صورة، كما عملت أيضاً على حل مشاكل كان لدي فيها 10 صور، ومشاكل تشمل كل ما بين هذه الأرقام. عندما أنظر إلى تطبيقات التصنيع، أعتقد أن وجود عشرات الصور أو ربما مائة صورة لنوع معين من العيوب ليس بالأمر الغريب، إلا أن هناك تفاوتاً واسعاً للغاية حتى داخل المصنع الواحد.
كما أجد أن ممارسات الذكاء الاصطناعي تتبدل عندما تقل أحجام مجموعة التدريب -فلنقل مثلاً- عن 10 آلاف مثال؛ لأن هذا الرقم بمنزلة عتبة يمكن خلالها للمهندس أن ينظر ببساطة إلى كل مثال ويصممه بنفسه ومن ثم يتخذ قراراً.
كنت أتحدث مؤخراً مع أحد المهندسين الأكفاء العاملين في إحدى شركات التكنولوجيا الكبرى. وسألته: "ماذا تفعل إذا كانت التصنيفات غير متسقة؟" فأجاب: "حسناً، لدينا فريق في الخارج مكون من عدة مئات من الأشخاص يقوم بعملية التصنيف؛ لذا سأكتب التعليمات الخاصة بالتصنيف، وسأطلب من ثلاثة أشخاص تصنيف كل صورة، ومن ثم سآخذ المتوسط". فقلت له: "نعم، هذا هو الشيء الصحيح الذي ينبغي عمله عندما يكون لديك مجموعة بيانات عملاقة". ولكن، عندما أعمل مع فريق أصغر حجماً وتكون التصنيفات غير متسقة، فإن كل ما أفعله هو العثور على الشخصين المختلفين في الرأي، وأُجري معهما مكالمة عبر تطبيق زووم، وأطلب منهما التحدث مع بعضهما البعض لمحاولة التوصل إلى حل.
أود أن نوجه اهتمامنا الآن نحو الحديث عن أفكارك حول الذكاء الاصطناعي العام. نشرتنا الإخبارية الخاصة بالذكاء الاصطناعي تسمى "الخوارزمية"، وقد منحت قراءنا الفرصة لطرح بعض الأسئلة عليك سابقاً. أحد القراء يتساءل: يبدو أن عملية تطوير الذكاء الاصطناعي تنقسم في الغالب بين الأبحاث الأكاديمية من جهة والبرامج واسعة النطاق وكثيفة الموارد التابعة للشركات الكبرى، مثل أوبن إيه آي (OpenAI) وديب مايند (DeepMind) من جهة أخرى، وهو ما لا يفسح مجالاً كبيراً لمساهمات الشركات الناشئة الصغيرة. لذا في رأيك، ما المشاكل العملية التي يمكن للشركات الصغيرة التركيز عليها فعلاً للمساعدة في دفع عملية اعتماد الذكاء الاصطناعي على الصعيد التجاري؟
أعتقد أن الاهتمام الإعلامي كثيراً ما يميل إلى التركيز على الشركات الكبرى، وفي بعض الأحيان على المؤسسات الأكاديمية الكبيرة. لكنك إذا ذهبت إلى المؤتمرات الأكاديمية، فستجد أن هناك الكثير من العمل الذي قامت به فرق بحثية ومختبرات أبحاث أصغر حجماً. وعندما أتحدث مع أشخاص مختلفين في شركات وصناعات متعددة، أشعر أن هناك الكثير جداً من التطبيقات التجارية التي يمكنهم استخدام الذكاء الاصطناعي لمعالجتها. كما أنني عادة ما أذهب إلى قادة الأعمال وأسألهم: "ما أكبر مشاكلكم في العمل؟ وما أكثر الأشياء التي تقلقكم؟" لكي أتمكن من فهم أهداف الشركة على نحو أفضل ومن ثم أتبادل معهم الأفكار حول ما إذا كان هناك حل يمكن أن يقدمه الذكاء الاصطناعي أم لا. وفي بعض الأحيان لا يوجد شيء يمكن أن نقدمه، ولا بأس في ذلك.
وربما سأشير هنا إلى اثنين من أوجه القصور التي أجدها جديرة بالاهتمام. أعتقد أن بناء أنظمة الذكاء الاصطناعي اليوم لا يزال يدوياً للغاية. لدينا عدد قليل من مهندسي التعلم الآلي وعلماء البيانات البارعين الذين يعملون على الحاسوب، ثم يدفعون الأمور بعد ذلك إلى مرحلة الإنتاج. ثمة الكثير من الخطوات اليدوية في هذه العملية، لذا فأنا متحمس لما يعرف باسم إم إل أوبس (ML ops) [أي: عمليات التعلم الآلي] باعتبارها تخصصاً جديداً يهدف للمساعدة في جعل بناء ونشر أنظمة الذكاء الاصطناعي عمليةً ممنهجة بشكل أكبر.
وكذلك إذا نظرت إلى الكثير من مشاكل العمل المعتادة -في جميع الوظائف من التسويق إلى إدارة المواهب- فستجد أن هناك مجالاً واسعاً للأتمتة وتحسين الكفاءة.
كما آمل أيضاً أن يتمكن مجتمع الذكاء الاصطناعي من إلقاء نظرة على المشاكل الاجتماعية الكبرى، لنرى ما الذي يمكننا القيام به إزاء قضية تغير المناخ أو ظاهرة التشرد أو الفقر. فبالإضافة إلى مشاكل العمل التي تكون بالغة الأهمية في بعض الأحيان، ينبغي أن نعمل على معالجة المشاكل الاجتماعية الكبرى أيضاً.
كيف تمضي فعلياً في عملية تحديد ما إذا كانت هناك فرصة لتحقيق شيء ما لشركتك باستخدام التعلم الآلي؟
سأحاول تعلم القليل عن العمل بنفسي، وسأحاول مساعدة قادة الأعمال أيضاً على تعلم القليل عن الذكاء الاصطناعي، ثم نُجري عادة عصفاً ذهنياً حول مجموعة من المشروعات. وبعد ذلك أُجري فحصاً فنياً وتجارياً لكل فكرة من الأفكار. من الناحية الفنية، سنحاول الإجابة عن الأسئلة التالية: هل لدينا بيانات كافية؟ وما مستوى دقتها؟ وهل سيكون هناك "ذيل طويل" [وهي إستراتيجية تجارية] عند الاستعانة بها في عملية الإنتاج؟ وكيف نسد الثغرات الموجودة في البيانات السابقة؟ وبالتالي نتأكد من أن حل المشكلة ممكن من الناحية التقنية. ثم يأتي دور الفحص التجاري: نتأكد من أن هذا الأمر سيحقق عائد الاستثمار الذي نأمله. وبعد هذه العملية يتبقى لدينا الأمور المعتادة، مثل تقدير الموارد اللازمة وتحديد المحطات الرئيسية، ومن ثم نأمل في أن نبدأ التنفيذ.
وهناك اقتراح آخر: من المهم أن تبدأ بسرعة، ولا بأس في أن تبدأ صغيراً. أول تطبيق تجاري ذو مغزى بالنسبة لي في جوجل كان التعرف على الكلام، وليس البحث عبر الويب ولا الإعلانات. فمن خلال مساعدة فريق الكلام في جوجل في جعل عملية التعرف على الكلام أكثر دقة، حظي فريق جوجل برين بالمصداقية والمال اللازمين للسعي وراء شراكات أكبر. وهكذا، كانت خرائط جوجل هي ثاني شراكة كبيرة لنا؛ حيث استخدمنا الرؤية الحاسوبية لقراءة أرقام المنازل، لتحديد المواقع الجغرافية للمنازل على خرائط جوجل. ولم أجر محادثات أكثر جدية مع فريق الإعلانات سوى بعد هذين المشروعين الناجحين. لذا، أعتقد أنني رأيت عدداً أكبر من الشركات تفشل في النهاية بسبب أنها بدأت كبيرة للغاية، أكثر مما رأيت شركات تفشل بسبب أنها بدأت صغيرة للغاية. لا بأس في أن تنفذ مشروعاً صغيراً لتبدأ به المؤسسة، لتعرف كيف سيبدو استخدام الذكاء الاصطناعي، ومن ثم تمضي قدماً لتكمل طريق النجاحات.
أخيراً، ما الشيء الذي يجب على جمهورنا البدء في فعله غداً لتطبيق الذكاء الاصطناعي في شركاتهم؟
انهضوا وانضموا إلينا، فالذكاء الاصطناعي يؤدي بالفعل إلى حدوث تحول في ديناميات العديد من الصناعات. لذا، إذا لم تكن شركتك تنفذ حالياً بالفعل استثمارات طموحة وذكية للغاية، فهذا هو الوقت المناسب.