في الساعات الماضية، تجددت المناوشات بين شركة OpenAI وxAI التابعة للمليادير الأمريكي إيلون ماسك، والتي بدأت حين أعلن الأخير عن نيته في شراء شركة OpenAI، أو تحويلها إلى مؤسسة خيرية غير ربحية، لتشتعل هذه المعركة مرة أخرى بعد اتهام أحد موظفي OpenAI بأن xAI كذبت بشأن قدرات Grok 3.
اتهامات من OpenAI لشركة xAI
وفقًا لموقع «techcrunch»، اتهم أحد موظفي شركة OpenAI شركة الذكاء الاصطناعي التابعة لـ«ماسك» xAI، بأنها كذبت بشأن قدرات تطبيقها التي أطلقته منذ أيام Grok 3، وأنها نشرت معلومات مضللة للمستخدمين، ليرد أحد مسؤولي الشركة المنافسة على الاتهام باتهام آخر.
نشرت شركة xAI بيان على مدونتها يستعرض قدرات نموذجها Grok 3، وهو عبارة عن رسم بياني وضح أداء Grok 3 في AIME 2025، وهي مجموعة من أسئلة الرياضيات الصعبة من اختبار رياضيات دعوة حديث، والتي شكك بها بعض الخبراء كمعيار تقييم لأداء الذكاء الاصطناعي، ولكن رغم ذلك، فـ AIME 2025 ما زالت تستخدم في الإصدارات الأقدم من الاختبار بشكل شائع لاستكشاف قدرة النموذج على الرياضيات.
أظهر النموذج أداء النموذجين Grok 3، Grok 3 Reasoning Beta و Grok 3 mini Reasoning، الذين تفوقوا على أداء أفضل نموذج متاح من OpenAI، o3-mini-high، في AIME 2025.
خرج موظفو شركة OpenAI ليردوا على هذه الإحصائية في منشور على إكس (تويتر سابقًا)، مشيرين إلى أن الرسم البياني الذي نشرته شركة xAI لم يتضمَّن درجة AIME 2025 الخاصة بـ o3-mini-high في اختبار «cons@64»، وهو أداة تعطي نموذجًا يحاول الإجابة على كل مشكلة في معيار ويأخذ الإجابات التي يتم إنشاؤها بشكل متكرر كإجابات نهائية، وهو يميل إلى تعزيز درجات معيار النماذج إلى حد كبير، وحذفه يثير الشكوك بشأن تفوق نماذج شركة xAI على OpenAI.
xAI ترد على اتهامات OpenAI
كتب أحد المؤسسين المشاركين لشركة xAI، إيجور بابوشكين، على إكس بأن شركة OpenAI نشرت معلومات مضللة في بشأن قدرات نماذجها في نفس الاختبار من قبل: «OpenAI نشرت مخططات معيارية مضللة مماثلة في الماضي - وإن كانت مخططات لمقارنة أداء نماذجها الخاصة»، وقال باحث الذكاء الاصطناعي ناثان لامبرت: «ربما يظل المقياس الأكثر أهمية لغزًا، في التكلفة الحسابية والنقدية التي استغرقها كل نموذج لتحقيق أفضل نتيجة له، وهذا يوضح مدى قلة ما تتواصل به معظم معايير الذكاء الاصطناعي بشأن حدود النماذج - ونقاط قوتها».
تعليقات الفيسبوك