نموذج "o3" من "OpenAI" يهلوس بنسبة 33%.. وتحذيرات من الاعتماد الكلي على الذكاء الاصطناعي


السبت 19 ابريل 2025 | 11:26 صباحاً
تحذيرات من الاعتماد الكلي على الذكاء الاصطناعي
تحذيرات من الاعتماد الكلي على الذكاء الاصطناعي
ابتسام الدوسري

رغم التقدّم الكبير الذي أحرزته شركة 'OpenAI' في تطوير نماذج الذكاء الاصطناعي، إلا أن التقارير الفنية الحديثة كشفت عن مفاجأة غير متوقعة، حيث أظهرت نماذجها الجديدة 'o3' و'o4-mini' معدلات أعلى من الهلوسة مقارنةً بالنماذج السابقة، مما يسلّط الضوء على التحديات المستمرة في هذا المجال.

تستعرض لكم صحيفة الاقتصاد السعودي تفاصيل هذه الظاهرة المثيرة للجدل، وأسباب قلق الباحثين من تأثيرات الهلوسة على دقة هذه النماذج، رغم تحسن أدائها في مجالات أخرى مثل البرمجة والرياضيات.

رغم التقدم: نماذج "o3" و"o4-mini" تعاني من تفاقم الهلوسة

ذكرت تقارير تقنية حديثة أن نماذج 'o3' و'o4-mini'، اللذان يمثلان الجيل الأحدث من نماذج التفكير التي طورتها 'OpenAI'، تُظهران أداءً أقل من المتوقع في مجال تقليل الهلوسة، وهي ظاهرة يعاني منها الذكاء الاصطناعي عند اختلاق معلومات غير صحيحة أو مضللة.

ووفقًا لاختبارات داخلية أجرتها 'OpenAI'، فإن نسبة الهلوسة في نموذج 'o3' بلغت 33% في اختبار 'PersonQA'، بينما بلغت في 'o4-mini' 48%، وهو ما يتجاوز بكثير نسبة الهلوسة في النماذج السابقة مثل 'o1' و'o3-mini' التي سجلت 16% و14.8% على التوالي.

"OpenAI" تُقر بعدم فهم أسباب التدهور في دقة النماذج الجديدة

أعربت شركة 'OpenAI' عن قلقها إزاء هذه النتائج، مؤكدة في تقريرها الفني أن هناك حاجة ماسة إلى مزيد من الأبحاث لفهم سبب ازدياد معدل الهلوسة مع توسع حجم نماذج التفكير.

وأوضحت الشركة أن النماذج الأحدث تميل إلى تقديم 'ادعاءات أكثر دقة'، لكنها في المقابل تميل أيضًا إلى تقديم عدد أكبر من الادعاءات غير الدقيقة أو المهلوسة، مما يجعل من الصعب الوثوق بإجاباتها، خصوصًا في التطبيقات الحساسة.

اختبارات خارجية تدعم نتائج "OpenAI": الهلوسة تمتد إلى خطوات الحلول

اختبارات أجرتها مؤسسة 'Transluce'، وهي جهة غير ربحية متخصصة في أبحاث الذكاء الاصطناعي، أظهرت أن نموذج 'o3' لا يقتصر على تقديم معلومات غير دقيقة، بل يختلق أحيانًا خطوات كاملة ضمن مسار التفكير المنطقي، ما يزيد من خطورة الاعتماد عليه في المهام المعتمدة على التسلسل والاستنتاج.

"نموذج التفكير".. تقنية واعدة بمشاكل غير متوقعة

على الرغم من أن توجه شركات الذكاء الاصطناعي في الآونة الأخيرة انصب على تطوير ما يسمى بـ'نماذج التفكير'، بهدف تحسين أداء الأنظمة دون الحاجة إلى موارد ضخمة، إلا أن النتائج تشير إلى أن التفكير قد يؤدي إلى مزيد من الهلوسة، مما يجعل هذا التوجه محفوفًا بالتحديات التقنية والأخلاقية.

تحذيرات من الاعتماد الكلي على الذكاء الاصطناعي
شركة OpenAI

اقرأ أيضا