أزمة القياس التي يفرضها الذكاء الاصطناعي
صُمِّم تقييم الأداء كما تمارسه معظم المؤسسات لعالم كانت فيه الصلة بين الجهد والمخرجات مرئية وقابلة للإسناد. المحلل الذي كتب 20 تقريراً كل ربع يمكن عدّ التقارير وتقييم جودتها. البائع الذي أجرى 150 مكالمة شهرياً يسجّل نظام CRM المكالمات ويعكس المسار الجهدَ.
يكسر الذكاء الاصطناعي هذه الصلة بطريقة محددة: يجعل الجهد غير مرئي. حين يستخدم مدير تسويق Claude أو ChatGPT لصياغة موجز حملة في 12 دقيقة بدلاً من 4 ساعات، تبقى جودة المخرجات غير قابلة للتمييز في معظمها، ومؤشر الأداء (عدد الموجزات المقدَّمة، وقت الصياغة) فقد معناه كإشارة أداء.
يرصد بحث SHRM 2026 الاستجابة المؤسسية لهذه الأزمة: الشلل. لا يقيس 56% من متخصصي الموارد البشرية نجاح استثمارات الذكاء الاصطناعي ببساطة. طوّر 16% فقط مقاييس عائد استثمار خاصة بهم. المؤسسات التي تحقق قيمة قابلة للقياس من الذكاء الاصطناعي — التي تصفها Gartner بأنها “ثلاثة أضعاف احتمالاً لتحقيق فائدة مالية أكبر” — هي تلك التي استبدلت صراحةً مقاييس الأنشطة بمقاييس النتائج.
يُفاقم حجم التحدي سرعة التبنّي. يجد بحث Worklytics أن الموظفين ثلاثة أضعاف احتمالاً لاستخدام الذكاء الاصطناعي في 30% أو أكثر من عملهم عما يظن القادة. وصل GitHub Copilot في غضون سنتين فقط إلى أكثر من 1.3 مليون مطوّر على خطط مدفوعة في أكثر من 50,000 مؤسسة. البنية التحتية لإدارة الأداء في معظم المؤسسات لم تواكب تحولاً وقع بالفعل في الأدوات التي يستخدمها الموظفون يومياً.
لماذا تفشل مقاييس الأنشطة في عصر التعزيز
المشكلة البنيوية في مقاييس الأنشطة للعمال المُعزَّزين بالذكاء الاصطناعي ليست أنها تقيس الأشياء الخاطئة — بل أنها كانت دائماً وكلاء عن النتائج، وكشف الذكاء الاصطناعي مدى هذه الوكالة المعيبة.
تنهار المقاييس القائمة على الحجم أولاً. المطوّر الذي يُسلّم 200 سطر كود مراجَع ومختبر أسبوعياً بمساعدة الذكاء الاصطناعي لا يمكن مقارنته على المقياس ذاته بمطوّر يُسلّم 200 سطر بلا مساعدة. الحجم متساوٍ؛ الحكم المُمارَس والحالات الحافّة المدروسة والدَّين التقني المُدرَج — هذه هي ما يُميّز الأداء.
تنعكس المقاييس الزمنية. حين يضغط الذكاء الاصطناعي مدة الإنجاز للجميع، قد يُعني المحلل الذي يستغرق وقتاً أطول أنه يُجري تحقّقاً أكثر صرامة من المخرجات — وهو أكثر قيمة — فيما يقبل المحلل الأسرع مخرجات الذكاء الاصطناعي دون تفكير نقدي.
تُخفق مقاييس الكمية. متخصص دعم العملاء الذي يعالج 80 تذكرة يومياً بمساعدة الذكاء الاصطناعي لا يُعدّ بالضرورة أعلى أداءً من متخصص يعالج 55 تذكرة بمشكلات أكثر تعقيداً ومُصعَّدة. المقياس يلتقط الإنتاجية لا الحكم.
يُضيف توقع Gartner أن 20% من المؤسسات ستستخدم الذكاء الاصطناعي لتسطيح الهياكل الإدارية بُعداً آخر: إذا أُتمِتَت الإشراف الإداري جزئياً، فإن تقييم الأداء التقليدي من أعلى إلى أسفل ذاته يستلزم إعادة تصميم، لا فقط المقاييس في داخله.
إعلان
كيف تبدو أطر KPI البديلة
تشترك المؤسسات التي أحرزت تقدماً على هذه المشكلة في نهج بنيوي: تُحدد كيف يبدو حكم الدور وصنع القرار حين يُنفَّذان جيداً، ثم تقيس الشواهد على ذلك الحكم لا الأنشطة المحيطة به.
1. نسبة النتيجة إلى الجهد كإشارة رئيسية
أوضح بديل لمقاييس الحجم هو ما يسميه بعض ممارسي تحليلات الموارد البشرية “نسبة النتيجة إلى الجهد”: قياس الأثر التجاري للعمل المُنجَز مقابل تقدير واقعي للجهد المبذول بما يشمل استخدام أدوات الذكاء الاصطناعي. المحلل التسويقي الذي ينتج حملة ذات معدل تحويل مرتفع بمساعدة الذكاء الاصطناعي يُظهر استخداماً فعّالاً للأدوات وحكماً مجالياً وجودة مخرجات في آنٍ واحد.
يوصي دليل MiHCM لإدارة الأداء 2026 بنهج متعدد الطبقات مع ثلاثة آفاق زمنية: مقاييس قصيرة المدى (معدلات تبنّي مسودات المراجعات والوقت الموفَّر لكل دورة) ومقاييس متوسطة المدى (تحسينات الاحتفاظ للمجموعات المستهدفة وسرعة الترقية ومعدلات التنقل الداخلي) ومقاييس طويلة المدى (تغييرات توزيع الأداء ومؤشرات الثقافة).
2. نهج Balanced Scorecard المُعاد معايرته للذكاء الاصطناعي
يوصي بحث Worklytics على أطر الأداء الشاملة للذكاء الاصطناعي بهيكل بطاقة نتائج متوازن بأربع فئات متساوية الوزن، تمثّل كل منها 25% من تقييم الأداء:
- المنظور المالي: مكاسب الكفاءة المدفوعة بالذكاء الاصطناعي والمساهمة في عائد استثمار الأدوات وتخفيض التكلفة لكل مخرج
- منظور العميل: جودة الردود وفاعلية التخصيص ودرجات رضا العملاء للتفاعلات المساعَدة بالذكاء الاصطناعي
- منظور العمليات الداخلية: معدلات تبنّي أدوات الذكاء الاصطناعي ومعدلات نجاح الأتمتة ومعدلات الخطأ في سير العمل المساعَد
- منظور التعلم والنمو: تقدم محو الأمية في الذكاء الاصطناعي والتكيف مع أدوات جديدة والمساهمة في تطوير قدرات الذكاء الاصطناعي للفريق
3. نهج التجربة العشوائية المضبوطة لقياس التجارب التجريبية
للمؤسسات في المراحل الأولى من نشر أدوات الذكاء الاصطناعي، توصي إرشادات MiHCM باستخدام تجارب عشوائية مضبوطة أو مجموعات مُطابَقة لعزل الأثر السببي للذكاء الاصطناعي على الأداء. يُطبّق إطار سنغافورة الحكومي للإنتاجية نهجاً مماثلاً من المجموعات المُطابَقة لتقييم برامج المهارات الوطنية، بمقارنة المشاركين بغير المشاركين المُطابَقين لا استخدام مقارنات قبل وبعد منفردة.
الصورة الكاملة: القياس كأداة لإدارة التغيير
إعادة ضبط مؤشرات KPI التي يُفرضها تعزيز الذكاء الاصطناعي هي في نهاية المطاف مشكلة إدارة تغيير بقدر ما هي مشكلة قياس. حين تُعلن المؤسسات أنها ستُقيّم الأداء بشكل مختلف، فهي تُشير إلى السلوكيات التي تُقدّرها — ويستجيب الموظفون لهذه الإشارات بتغيير سلوكهم.
ستشهد المؤسسات التي تقيس معدل تبنّي أدوات الذكاء الاصطناعي كبُعد أداء تبنّي الموظفين للأدوات لتحسين درجاتهم. أما التي تقيس جودة النتائج لا حجم المخرجات فستشهد استثمار الموظفين وقتاً أكبر في خطوات الحكم والتحقق التي تُحدد جودة النتائج.
تُظهر بيانات SHRM أن 57% من المؤسسات ترى حالياً أن الذكاء الاصطناعي يُولّد “فرص رفع المهارات وإعادة التأهيل” لا تسريح العمال (7%). هذه النسبة — الفرق بين موجة رفع مهارات وموجة تسريح — تعتمد اعتماداً جوهرياً على ما إذا كانت المؤسسات تُنشئ أطر أداء تُكافئ التعاون الفعّال مع الذكاء الاصطناعي.
المؤسسات المتقدمة حالياً على هذه المسألة تشترك في خاصية واحدة: بدأت بتعريف كيف يبدو الحكم الممتاز في دور مساعَد بالذكاء الاصطناعي، ثم بنت نظام القياس للكشف عنه. هذا التسلسل — الحكم أولاً والمقاييس ثانياً — هو عكس كيفية تعامل معظم المؤسسات مع إدارة الأداء.
الأسئلة الشائعة
كيف تقيس أداء موظف حين يتولى الذكاء الاصطناعي معظم عمل الكتابة؟
الجواب هو التوقف عن قياس نشاط الكتابة والبدء في قياس جودة الحكم. للأدوار التي يتولى فيها الذكاء الاصطناعي الصياغة الأولية، تكون المهارة المُميِّزة للأداء هي القدرة على تحديد الأخطاء في مخرجات الذكاء الاصطناعي وإضافة السياق المجالي المتخصص وإيصال الأفكار المعقدة وضوحاً للمعنيين وصنع القرارات حول متى تتجاوز توصية الذكاء الاصطناعي. المقاييس التي تلتقط هذه السلوكيات تشمل معدلات الخطأ في المخرجات المساعَدة ورضا المعنيين عن التسليمات النهائية.
ما خطر الاعتماد بشكل مفرط على معدلات تبنّي أدوات الذكاء الاصطناعي كمقياس أداء؟
يُنشئ قياس تكرار التبنّي حافزاً خاطئاً: يُحسّن الموظفون استخدام الأداة لا تحقيق نتائج جيدة. الموظف الذي يمرّر كل بريد إلكتروني عبر مساعد كتابة بالذكاء الاصطناعي ويُقدّم جميع المخرجات دون تفكير نقدي “مرتفع” في التبنّي لكن ربما أقل أداءً من موظف يستخدم الذكاء الاصطناعي بانتقائية. المقياس الصحيح ليس معدل التبنّي بل جودة النتائج في العمل المساعَد.
هل يجب على الشركات تضمين استخدام أدوات الذكاء الاصطناعي في تقييمات الأداء الرسمية؟
نعم — لكن مُصاغاً كبُعد محو أمية وفعالية لا كمقياس امتثال أو تكرار. السؤال ليس “هل استخدمت الذكاء الاصطناعي هذا الربع؟” بل “كيف دمجت بفعالية أدوات الذكاء الاصطناعي في القرارات عالية المخاطر، وما الشواهد على أن استخدامك للذكاء الاصطناعي حسّن النتائج لا مجرد تسريع الإنتاجية؟”
المصادر والقراءات الإضافية
- حالة الذكاء الاصطناعي في الموارد البشرية 2026 — SHRM
- الذكاء الاصطناعي في إدارة الأداء: الدليل الشامل 2026 — MiHCM
- استخدام الذكاء الاصطناعي وتقييمات الأداء: أفضل الممارسات — Worklytics
- مقاييس الأداء في 2026: ما يجب على قادة الموارد البشرية إعادة التفكير فيه — PossibleWorks
- اتجاهات القوى العاملة في الذكاء الاصطناعي 2026 — Gloat
- وقت التركيز يبلغ أدنى مستوياته منذ 3 سنوات: التكاليف الخفية لنشر الذكاء الاصطناعي — HR Executive






