تقنية

إن اختبار الذكاء الاصطناعي العام (AGI) أقرب إلى الحل، لكنه قد يكون معيبًا

أصبح الاختبار المعروف للذكاء العام الاصطناعي (AGI) أقرب إلى الحل. لكن واضعي الاختبارات يقولون إن هذا يشير إلى عيوب في تصميم الاختبار، وليس اختراقًا بحثيًا حقيقيًا.

في عام 2019، قدم فرانسوا شوليه، وهو شخصية بارزة في عالم الذكاء الاصطناعي، معيار ARC-AGI، وهو اختصار لعبارة “الملخص والمنطق للذكاء العام الاصطناعي”. تم تصميمه لتقييم ما إذا كان نظام الذكاء الاصطناعي يمكنه اكتساب مهارات جديدة بكفاءة خارج البيانات التي تم تدريبه عليها، ARC-AGIكما يزعم فرانسوا، يظل اختبار الذكاء الاصطناعي الوحيد لقياس التقدم نحو الذكاء العام (على الرغم من ذلك). آحرون تم اقتراحها.)

حتى هذا العام، لم يتمكن الذكاء الاصطناعي الأفضل أداءً من حل سوى ما يقل قليلاً عن ثلث المهام في ARC-AGI. وألقى شوليه باللوم على تركيز الصناعة على نماذج اللغات الكبيرة (LLMs)، والتي يعتقد أنها غير قادرة على “الاستدلال” الفعلي.

“يواجه طلاب ماجستير اللغة الإنجليزية صعوبة في التعميم، نظرًا لاعتمادهم الكامل على الحفظ”. قال في سلسلة من المنشورات على X في فبراير. “إنهم يكسرون أي شيء لم يكن موجودًا في بيانات التدريب الخاصة بهم.”

ومن وجهة نظر شوليه، فإن حاملي شهادات الماجستير في القانون عبارة عن آلات إحصائية. ومن خلال تدريبهم على الكثير من الأمثلة، يتعلمون الأنماط في تلك الأمثلة لإجراء تنبؤات، مثل عبارة “إلى من” في رسالة البريد الإلكتروني التي تسبق عادةً عبارة “قد يهمني الأمر”.

يؤكد شوليه أنه على الرغم من أن طلاب ماجستير القانون قد يكونون قادرين على حفظ “أنماط الاستدلال”، فمن غير المرجح أن يتمكنوا من توليد “استدلال جديد” يعتمد على مواقف جديدة. “إذا كنت بحاجة إلى التدريب على العديد من الأمثلة على النمط، حتى لو كان ذلك ضمنيًا، من أجل تعلم تمثيل قابل لإعادة الاستخدام له، فأنت تحفظ” جادل في وظيفة أخرى.

لتحفيز الأبحاث خارج نطاق ماجستير إدارة الأعمال، أطلق مايك نوب، المؤسس المشارك لشوليت وزابير، في يونيو مشروعًا بقيمة مليون دولار. مسابقة لبناء ذكاء اصطناعي مفتوح المصدر قادر على التغلب على ARC-AGI. من بين 17,789 مشاركة، حصل أفضل المرشحين على 55.5%، أي أعلى بنسبة 20% تقريبًا من أفضل هداف لعام 2023، وإن كان أقل من عتبة “المستوى البشري” المطلوبة للفوز وهي 85%.

يقول نوب إن هذا لا يعني أننا اقتربنا بنسبة 20% تقريبًا من الذكاء الاصطناعي العام.

في أ مشاركة مدونةقال نوب إن العديد من الطلبات المقدمة إلى ARC-AGI كانت قادرة على “القوة الغاشمة” في طريقها إلى الحل، مما يشير إلى أن “جزءًا كبيرًا” من مهام ARC-AGI “[don’t] تحمل الكثير من الإشارات المفيدة نحو الذكاء العام.

يتكون ARC-AGI من مسائل تشبه الألغاز حيث يتعين على الذكاء الاصطناعي، في ضوء شبكة من المربعات ذات الألوان المختلفة، إنشاء شبكة “الإجابة” الصحيحة. تم تصميم المشكلات لإجبار الذكاء الاصطناعي على التكيف مع المشكلات الجديدة التي لم يسبق له رؤيتها من قبل. لكن ليس من الواضح أنهم يحققون ذلك.

المهام في معيار ARC-AGI. يجب أن تحل النماذج “المشكلات” في الصف العلوي؛ يظهر الصف السفلي الحلول. اعتمادات الصورة:ARC-AGI

“[ARC-AGI] “لم يتغير منذ عام 2019 وليس مثاليًا” ، اعترف نوب في منشوره.

كما واجه فرانسوا وكنوب نقد للإفراط في بيع ARC-AGI كمعيار للذكاء الاصطناعي العام – في وقت يتم فيه التنافس بشدة على تعريف الذكاء الاصطناعي العام. أحد موظفي OpenAI مؤخرًا ادعى أن الذكاء الاصطناعي العام قد تم تحقيقه “بالفعل” إذا تم تعريف الذكاء الاصطناعي العام على أنه ذكاء اصطناعي “أفضل من معظم البشر في معظم المهام”.

ويقول نوب وشوليت إنهما يخططان لإصدار معيار ARC-AGI من الجيل الثاني لمعالجة هذه المشكلات، إلى جانب المنافسة في عام 2025. وكتب شوليت في رسالة X: “سنواصل توجيه جهود مجتمع البحث نحو ما نعتبره أهم المشكلات التي لم يتم حلها في الذكاء الاصطناعي، وتسريع الجدول الزمني للذكاء الاصطناعي العام”. بريد.

من المرجح أن الإصلاحات لن تأتي بسهولة. إذا كانت عيوب اختبار ARC-AGI الأول تمثل أي مؤشر، فإن تعريف الذكاء الاصطناعي سيكون أمرًا صعبًا أيضًا. التهابات – كما كان بالنسبة للبشر.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى