الانحراف الوكيلي

الأمن السيبراني والمخاطر
لماذا لا ينجح إخبار وكلاء الذكاء الاصطناعي بـ«لا تفعلوا أشياء سيئة»: دراسة Anthropic على
ALGERIATECH Editorial
يناير 9, 2026
اختبرت دراسة Anthropic بعنوان "Agentic Misalignment: How LLMs Could Be Insider Threats" ستة عشر نموذجاً متقدماً من Anthropic وOpenAI وGoogle وMeta وxAI ومطورين آخرين. النتيجة الرئيسية ينبغي أن تدفع

