استهلاك الطاقة في الذكاء الاصطناعي.. كيف تؤثر طبيعة الطلب على الكهرباء المستهلكة
لماذا قد يستهلك طلب واحد على الذكاء الاصطناعي كهرباء أكثر 100 مرة من آخر؟
الذكاء الاصطناعي قد يبدو خفيفًا، مجرد نصوص وصور وفيديو على الشاشة، لكن كل طلب يعمل على خوادم تستهلك كهرباء حقيقية، وأظهرت قياسات حديثة أن بعض مهام الذكاء الاصطناعي تتطلب طاقة أكبر بكثير من غيرها.
أظهرت الاختبارات المباشرة على الأنظمة الحديثة أن إنتاج فيديو واحد باستخدام الذكاء الاصطناعي قد يستهلك أكثر من 100 مرة طاقة إنتاج صورة واحدة.
الدراسة المنشورة على arXiv، أظهرت أن الفارق لا يعود فقط إلى حجم النموذج، بل يعتمد على ما يُطلب من النظام إنتاجه وكيفية إعداداته.
لجعل هذه الفروق واضحة، بنى مهندسون في جامعة ميشيغان نظام قياس مفتوح يوضح استهلاك الطاقة إلى جانب السرعة والجودة لنفس النماذج والمهام.
مؤشر الطاقة الجديد للذكاء الاصطناعي
على لوحة قيادة ML.ENERGY، تظهر الفجوات في استهلاك الطاقة بوضوح إلى جانب السرعة والجودة لنفس النماذج.
من خلال تطوير الأدوات المفتوحة خلف هذه اللوحة، وثق المهندسون كيف أن نفس النموذج في إعدادات مختلفة قد يستهلك كهرباء بشكل متباين للغاية.
في أنظمة اللغة والصور والفيديو، لم تكن الفروق الأكبر نتيجة حجم النموذج فقط، بل طريقة إعداد النظام وما يُطلب منه إنتاجه.
كيفية قياس طاقة الذكاء الاصطناعي
سجل فريق جامعة ميشيغان الطاقة عبر 46 نموذجًا وسبع مهام مختلفة، شملت 1,858 إعدادًا للأجهزة والبرامج.
تركزت القياسات على مرحلة الاستدلال، أي لحظة إجابة النموذج المدرب على طلب، لأنها المرحلة التي تبذل فيها الخوادم معظم الجهد.
في الاقتصاد الأوسع للذكاء الاصطناعي، قدّر مؤشر ML.ENERGY أن الاستدلال يمثل 80 إلى 90 بالمئة من إجمالي الطلب الحاسوبي.
تأثير طبيعة الطلب على استهلاك الطاقة
بالنسبة لنماذج اللغة، يعتمد استهلاك الطاقة بشكل كبير على طريقة توليد الردود، أحيانًا استهلاك حل المشكلات استهلك 25 مرة كهرباء أكثر من محادثة عادية.
يعتمد ذلك على “الوحدات الصغيرة” أو tokens التي ينتجها النموذج، كل وحدة إضافية تشغّل دورة حسابية جديدة داخل الخادم.
إعدادات الحوسبة ومجموعات الطلبات
تغيير حجم المجموعة batch size يمكن أن يقلل استهلاك الطاقة لكل وحدة من 3 إلى 5 مرات قبل أن تتوقف المكاسب، لكن المجموعات الأكبر تؤخر كل رد، ما يرفع زمن الانتظار.
عندما يكون العتاد بطيئًا
استهلاك الطاقة لا يتعلق بالنموذج فقط؛ أحيانًا يكون أكبر هدر للطاقة نتيجة خطوات التحضير قبل وصول الطلب إلى وحدة المعالجة الرسومية GPU.
دقة الأرقام وأنماط المرور
حتى مع نفس النموذج، قد تؤثر إعدادات الدقة على استهلاك الطاقة، استخدام تنسيقات رقمية أصغر لا يقل دائمًا استهلاك الكهرباء بسبب الحاجة لتحويل البيانات.
تصميم الذكاء الاصطناعي مع مراعاة الطاقة
يمكن للفرق تتبع الطاقة لكل طلب أثناء تطوير النماذج، باستخدام أدوات جامعة ميشيجان لتجربة إعدادات توازن بين الأداء والطاقة.
النموذج الأكثر كفاءة يعتمد على حجم الطلبات، سرعة الاستجابة المقبولة، وطريقة توزيع العمل بين الأجهزة.





