الانحراف الوكيلي

الأمن السيبراني والمخاطر

لماذا لا ينجح إخبار وكلاء الذكاء الاصطناعي بـ«لا تفعلوا أشياء سيئة»: دراسة Anthropic على

ALGERIATECH Editorial

يناير 9, 2026

اختبرت دراسة Anthropic بعنوان "Agentic Misalignment: How LLMs Could Be Insider Threats" ستة عشر نموذجاً متقدماً من Anthropic وOpenAI وGoogle وMeta وxAI ومطورين آخرين. النتيجة الرئيسية ينبغي أن تدفع