مشكلة القياس التي تواجهها المؤسسات أخيرًا
كانت الرواية السائدة حول أدوات البرمجة بالذكاء الاصطناعي في 2025 واضحة: المطوّرون أكثر إنتاجيةً بكثير، والمؤسسات التي لا تتبنّى أدوات الذكاء الاصطناعي ستتأخر، والمكاسب الإنتاجية واضحة وبديهية. نشر GitHub Copilot دراسات تُظهر 55% تسريعًا في إتمام الأكواد.
في 2026، اصطدمت هذه الرواية بالقياس الفعلي. حين توقّف الباحثون عن سؤال المطوّرين عن شعورهم — وبدأوا في قياس المدة الفعلية للمهام — ظهرت صورة مختلفة.
نشرت METR، وهي منظمة بحثية للذكاء الاصطناعي تركّز على السلامة، في فبراير 2026 نتائج دراسة مضبوطة على مطوّري مفتوح المصدر ذوي الخبرة. كانت المنهجية صارمة: يُدفع للمطوّرين 50 دولارًا في الساعة للعمل على مستودعات مفتوحة المصدر، مع تعيين المهام عشوائيًا إلى شرطَي “الذكاء الاصطناعي مسموح” أو “الذكاء الاصطناعي غير مسموح”. جرى قياس أوقات الإنجاز مباشرةً لا بالإفادة الذاتية. كان المشاركون ذوي خبرة بمتوسط 10 سنوات. الأدوات المتاحة كانت من الأحدث: Cursor Pro مع Claude 3.5 و3.7 Sonnet.
النتيجة: استغرق المطوّرون وقتًا أطول بـ19% لإنجاز المهام باستخدام أدوات الذكاء الاصطناعي مقارنةً بدونها. متابعة في أواخر 2025 شملت 57 مطوّرًا عبر 143 مستودعًا كشفت نتائج مختلطة — تباطؤ 18% بين المجموعة الأصلية و4% بين المجنّدين الجدد — دون نتائج ذات دلالة إحصائية قاطعة.
دراسة METR ليست منفردة. وجد استطلاع Section AI Consulting لـ5000 موظف ذوي ياقة بيضاء أن ثلثَيهم يُفيدون بأن الذكاء الاصطناعي يوفّر لهم صفرًا إلى ساعتين أسبوعيًا. وكشف استطلاع PwC للقوى العاملة من 50000 عامل أن 92% من مستخدمي الذكاء الاصطناعي اليوميين يُبلّغون بإنتاجية أعلى من زملائهم — نتيجة تبدو متعارضة مع قياس أوقات المهام لدى METR.
الفجوة بين الإنتاجية المُبلَّغ عنها ذاتيًا والإنتاجية المقاسة ليست خطأ تقريبًا. إنها ظاهرة هيكلية لها اسم: مفارقة إنتاجية الذكاء الاصطناعي.
لماذا توجد فجوة الإدراك-الواقع
تحيّز الطلاقة المعرفية: أدوات الذكاء الاصطناعي تجعل تجربة كتابة الأكواد تبدو أسرع وأيسر. الشعور بضغط معرفي أقل لا يعني إنتاج عمل أكثر.
مشكلة “الورق المموّه”: ظاهرة بات يُطلق عليها “workslop” — عمل مُنتَج بالذكاء الاصطناعي يبدو موثوقًا لكنه يفتقر إلى الجوهر اللازم للتقدم في المهام — موثّقة بشكل متزايد في بيئات المؤسسات. وجد بحث Workday أن الوقت الذي وفّره الموظفون عبر الذكاء الاصطناعي تبدّد في المراجعة الممتدة للمحتوى المُنتَج.
تحيّز اختيار المهام: حدّد مؤلّفو METR تحيّزًا حرجًا: 30 إلى 50% من المطوّرين أبلغوا عن اختيارهم عدم تقديم بعض المهام لأنهم لم يرغبوا في إنجازها بدون ذكاء اصطناعي. يعني ذلك أن التباطؤ المقاس يُقلّل على الأرجح من الأثر الفعلي للذكاء الاصطناعي.
عبء المراجعة: الكود المُنتَج بالذكاء الاصطناعي يحتاج مراجعة. لقرارات المعمارية الجديدة والحالات الطرفية والكود الحرج أمنيًا، المراجعة بطيئة والمخرج غالبًا خاطئ بصورة خفية.
إعلان
ما يجب على قادة الهندسة فعله بهذه البيانات
1. فصل قياس إنتاجية الذكاء الاصطناعي حسب نوع المهمة
تختفي مفارقة الإنتاجية عند الفصل التفصيلي. تُسرّع أدوات الذكاء الاصطناعي بشكل مثبَت فئات معينة من المهام: توليد الكود النمطي، كتابة الاختبارات للوظائف المعروفة جيدًا، الترجمة بين لغات البرمجة، تلخيص التوثيق. ينبغي لقادة الهندسة إجراء تدقيق 90 يومًا على المهام: تصنيف التوزيع الفعلي للعمل الذي تؤديه فرقهم، ثم قياس أداء أدوات الذكاء الاصطناعي منفصلًا لكل فئة.
2. إصلاح اختناق المراجعة قبل توسيع نطاق توليد الكود بالذكاء الاصطناعي
يشير بحث Workday إلى فشل محدد في كيفية نشر معظم المؤسسات أدوات البرمجة بالذكاء الاصطناعي: تبنّت الفرق توليد الذكاء الاصطناعي دون بناء بنية تحتية للمراجعة في الوقت ذاته. الحل ليس إزالة توليد الذكاء الاصطناعي؛ بل بناء بنية تحتية المراجعة.
3. قياس وقت الإنجاز لا الرضا — ثم نشر النتائج داخليًا
إن كانت مؤسستك تقيس إنتاجية الذكاء الاصطناعي عبر استطلاعات، ستحصل على نتيجة إدراك METR: الجميع يشعر بالسرعة. ينبغي لقادة الهندسة إجراء تجربة مضبوطة داخلية — 8 إلى 12 أسبوعًا، مقارنة أوقات الإنجاز على مهام متطابقة مع وبدون أدوات الذكاء الاصطناعي — باستخدام منهجية METR: القياس المباشر لا الإفادة الذاتية.
4. إعادة تأطير قيمة الذكاء الاصطناعي من الإنتاجية إلى توسيع القدرات
إعادة التأطير الأهم التي تفرضها مفارقة الإنتاجية ليست “أدواتنا لا تعمل” — بل “نقيس الشيء الخطأ”. قيمة الذكاء الاصطناعي في مراجعة الكود وفحص الأمن واختبار إمكانية الوصول وتحليل الأداء ليست السرعة بالدرجة الأولى — بل التغطية.
سيناريو التصحيح
نتيجة METR وبيانات استطلاع PwC ليستا دواعي لعكس تبنّي أدوات الذكاء الاصطناعي. بل دواعٍ للتبنّي بعناية أكبر. وجد استطلاع PwC للقوى العاملة أن 92% من مستخدمي الذكاء الاصطناعي اليوميين يُبلّغون بإنتاجية أعلى من زملائهم. حلّ التعارض: المستخدمون الكثيفون للذكاء الاصطناعي تعلّموا أي المهام يستخدمون الذكاء الاصطناعي عليها — مهارة ضمنية تستغرق أشهرًا من التجربة والخطأ.
التداعية المؤسسية: استثمر في التدريب على إتقان الذكاء الاصطناعي لا مجرد الوصول إلى أدواته. الوصول للأدوات بلا انضباط نوع المهمة وبنية تحتية للمراجعة ينتج المفارقة. الوصول للأدوات مع تهيئة منظّمة وتدقيق المهام وقياس أمين ينتج مضاعفات الإنتاجية الأربعة التي تحقّقها أكثر مؤسسات الهندسة الأصيلة في الذكاء الاصطناعي نجاحًا.
الأسئلة الشائعة
ما الذي وجدته دراسة METR بالضبط وكيف يُفسَّر رقم التباطؤ 19%؟
وجدت دراسة METR في فبراير 2026 أن مطوّري مفتوح المصدر ذوي الخبرة (متوسط 10 سنوات) أنجزوا المهام أبطأ بـ19% مع أدوات الذكاء الاصطناعي رغم الإفادة بتسريع مُدرَك بـ20%. رصد METR تحيّزًا مهمًا: 30 إلى 50% من المطوّرين اختاروا عدم تقديم مهام لم يرغبوا في إنجازها بدون الذكاء الاصطناعي، مما يعني أن التباطؤ المقاس قد يُقلّل من الأثر الفعلي للذكاء الاصطناعي على أنواع المهام التي يختار المطوّرون استخدامه عليها.
هل مفارقة إنتاجية الذكاء الاصطناعي خاصة بتطوير البرمجيات فحسب؟
لا. يظهر النمط عبر فئات العمل المعرفي. وجد استطلاع Section AI Consulting من 5000 موظف أن ثلثَيهم يُفيدون بأن الذكاء الاصطناعي يوفّر صفرًا إلى ساعتين أسبوعيًا. وجد بحث Workday أن مدخرات وقت الذكاء الاصطناعي تبدّدت في وقت مراجعة المحتوى. وجد استطلاع PwC للرؤساء التنفيذيين العالميين (4454 مديرًا، 95 دولة) أن 56% يُفيدون بعدم استفادتهم من الذكاء الاصطناعي بينما 12% فحسب يُبلّغون بنمو الإيرادات مع خفض التكاليف.
ما هو “workslop” ولماذا يهمّ عمليات نشر الذكاء الاصطناعي المؤسسي؟
“Workslop” عمل مُنتَج بالذكاء الاصطناعي يبدو موثوقًا لكنه يفتقر إلى الجوهر اللازم للتقدم في المهمة بصورة هادفة — مخرج مصقول بعيوب خفية تستهلك وقت المراجعة قبل ظهور الأخطاء. يُشير بحث Workday إلى انتشار workslop في عمليات النشر المؤسسي للذكاء الاصطناعي، إذ يُفوّض المديرون كثيرًا مراجعة مخرجات الذكاء الاصطناعي إلى مرؤوسيهم.
—














