أدوات البرمجة بالذكاء الاصطناعي تخطئ في 25% من الحالات
الذكاء الاصطناعي لا يزال غير دقيق في كتابة الأكواد.. نتائج مقلقة
كشفت دراسة حديثة من جامعة واترلو، أن أدوات البرمجة المعتمدة على الذكاء الاصطناعي لا تزال ترتكب أخطاء في نحو ربع الحالات، ما يثير تساؤلات حول مدى موثوقيتها في تطوير البرمجيات دون إشراف بشري.
نتائج الدراسة
أظهرت الدراسة، التي نُشرت في Transactions on Machine Learning Research ، ومن المقرر عرضها في مؤتمر ICLR 2026، أن دقة النماذج المتقدمة لا تتجاوز 75%، بينما سجلت النماذج مفتوحة المصدر نحو 65% فقط.
وقام الباحثون بتقييم 11 نموذجًا من نماذج اللغة الكبيرة عبر 18 نوعًا من المخرجات المهيكلة و44 مهمة مختلفة، لقياس مدى التزامها بالقواعد المحددة ودقة النتائج.

ما هي المخرجات المهيكلة؟
تسعى شركات التكنولوجيا إلى تحسين أداء الذكاء الاصطناعي عبر ما يُعرف بـ”المخرجات المهيكلة”، والتي تُلزم النماذج بإنتاج إجابات وفق صيغ محددة مثل JSON وXML وMarkdown، ما يسهل قراءتها ودمجها في الأنظمة البرمجية.
نقاط الضعف
رغم التحسن النسبي، أظهرت النتائج أن النماذج تؤدي بشكل جيد في المهام النصية، لكنها تواجه صعوبات كبيرة في المهام الأكثر تعقيدًا مثل إنشاء الصور والفيديوهات أو تطوير مواقع الويب.
كما أوضح الباحثون، أن التقييم لم يقتصر على صحة الصياغة، بل شمل أيضًا دقة النتائج ومدى توافقها مع متطلبات المهام.
الحاجة للإشراف البشري
أكد الباحثون أن الذكاء الاصطناعي لا يزال بحاجة إلى إشراف بشري مكثف، حيث يمكن استخدامه كمساعد للمطورين، لكنه لا يصلح بعد للعمل بشكل مستقل في تطوير البرمجيات.
وأشار الفريق إلى أن هذه النتائج تسلط الضوء على أهمية الاستمرار في تطوير أدوات الذكاء الاصطناعي وتحسين قدرتها على إنتاج مخرجات دقيقة وموثوقة.





