الترتيب الذي فاجأ مختبرات الذكاء الاصطناعي الغربية
طوال معظم عام 2024، كان تدفق رموز OpenRouter تهيمن عليه Anthropic وOpenAI وGoogle. تغيّر ذلك مطلع 2025 وتسارع خلال 2026. وفقاً لقائمة OpenRouter لشهر يونيو 2026 التي رصدتها OfficeChai، تستحوذ DeepSeek وحدها على 16.3% من إجمالي حجم الرموز المُحدَّدة — المرتبة الأولى متقدمةً على Anthropic (15.5%) وGoogle (13.2%) وOpenAI (8.7%). وبالمجموع، يمثّل مزودو الخدمات الصينيون (DeepSeek وXiaomi وTencent وMiniMax وQwen/Alibaba) ما يقارب 44% من أسهم الرموز بين أفضل العشرة في يونيو.
في وقت سابق من العام، كانت الحصة الصينية أعلى من ذلك. أفادت Trendingtopics.eu بأنه خلال الأسبوع الممتد من 16 إلى 22 مارس 2026، أنتجت النماذج الصينية 7.36 تريليون رمز — ما يعادل نحو 61% من 12.1 تريليون رمز استُهلك أسبوعياً في ذروة النشاط. وقد مثّل ذلك ارتفاعاً بنسبة 56.9% أسبوعاً على آخر، تحرّكه أعباء عمل البرمجة التي باتت تُشكّل أكثر من 50% من استخدام رموز API العالمية، ارتفاعاً من 11% فقط في مطلع 2025.
وقد عزّز وتيرة الإصدارات هذا التحوّل في السوق؛ إذ أطلق أربعة مختبرات صينية — Z.ai وMiniMax وMoonshot AI وDeepSeek — تحديثات رئيسية لنماذج مفتوحة الأوزان خلال 12 يوماً فحسب في مطلع مايو 2026: GLM-5.1 وMiniMax M2.7 وKimi K2.6 وDeepSeek V4. هذه الوتيرة تُشير إلى أن تطوير النماذج مفتوحة الأوزان في الصين ليس اضطراباً عابراً بل استراتيجية صناعية متواصلة.
الفجوة السعرية ليست خطأً في التقريب
الفوارق السعرية بين النماذج الصينية والغربية كبيرة لدرجة تبدو معها شبه مستحيلة. احتلّ DeepSeek V4-Flash المرتبة الأولى على OpenRouter لثلاثة أسابيع متتالية حتى 8 يونيو 2026 بسعر 0.28 دولار فقط لكل مليون رمز إخراج — أي ما يعادل نحو 54 ضعفاً أرخص من Claude Sonnet 4.6 (15.00 دولاراً) وأكثر من 100 ضعف أرخص من GPT-5.5 (30.00 دولاراً)، بفضل هندسة mixture-of-experts (MoE) بـ284 مليار معامل لا تُنشَّط منها سوى 13 مليار معامل في كل مسار استدلال.
ينسحب هذا النمط على سائر النماذج الصينية. أظهرت بيانات Trendingtopics.eu السابقة الصادرة في مارس 2026 تسعير MiniMax M2.5 بـ0.30 دولار للإدخال و1.10 دولار للإخراج لكل مليون رمز، فيما بلغت أسعار Claude Opus 4.6 نحو 5.00 دولار إدخالاً و25.00 دولاراً إخراجاً — فجوة تتراوح بين 10 و23 ضعفاً بين هذين النموذجين وحدهما. وكشفت مقارنة مباشرة بين Qwen 3.7 Max وMiniMax M3 نشرتها AIMadeTools أن تشغيل وكيل ذكاء اصطناعي على مدار الساعة على MiniMax M3 يكلّف نحو 360 دولاراً شهرياً مقارنةً بـ1,080 دولاراً لـQwen 3.7 Max، فيما يتفوق MiniMax M3 قليلاً على Qwen في معيار SWE-bench Pro للبرمجة (59.0% مقابل ~58%).
ونحو 80% من الشركات الناشئة في الذكاء الاصطناعي المُستَطلَعة تحوّلت إلى النماذج الصينية وفق تحليل Trendingtopics.eu لمارس — رقم يتوافق مع ما رصده Crypto Briefing من تحوّل صامت للشركات الأمريكية الناشئة نحو LLM صينية. بالنسبة للشركات الناشئة التي تُحرق حوسبة في حلقات الوكلاء، الحساب حسابي لا تفضيلي: تخفيض 20 ضعفاً في تكلفة الاستدلال إما يمدّد السيولة لفصول إضافية أو يُتيح منتجات لم تكن مجدية اقتصادياً في السابق.
إعلان
تقارب الأداء هو المحرك الهيكلي
التكلفة وحدها لا تفسّر التبني — المطورون لا يُضحّون بالجودة مقابل السعر إذا كانت الفجوة واسعة. لكن فجوة الجودة تضيّقت لدرجة باتت “غير مرئية وظيفياً” في غالبية حالات الاستخدام الإنتاجية.
حقّق MiniMax M2.5 نسبة 80.2% على SWE-Bench Verified مقارنةً بـ80.8% لـClaude Opus 4.6 — فارق 0.6 نقطة مئوية على معيار يقيس مهام هندسة برمجية حقيقية. كما أن DeepSeek V4-Flash لا يبعد سوى 1.6 نقطة مئوية عن نظيره الأغلى V4-Pro في معايير البرمجة. على Arena Elo في مايو 2026، سجّلت أفضل النماذج الصينية 1,449 مقارنةً بنطاق 1,481 إلى 1,503 للنماذج الغربية الرائدة — فجوة وصفها تحليل abhs.in بأنها “ذات دلالة لكن قابلة للتجاوز”.
المتجه الأوضح للأداء هو البرمجة الوكيلية. باتت البرمجة تمثّل أكثر من نصف إجمالي استهلاك الرموز على OpenRouter، وهي حمل العمل الذي تقارب فيه النماذج الصينية أسرع. نافذة سياق DeepSeek V4-Flash البالغة 384,000 رمز إخراجاً كحدّ أقصى — جنباً إلى جنب مع ترخيص MIT مفتوح المصدر — تجعله جذاباً هيكلياً لجلسات البرمجة الذاتية الطويلة والأنابيب الدُّفعية وأطر العمل متعددة الوكلاء.
تتجاوز أهمية الأوزان المفتوحة مجرد التكلفة؛ إذ نشرت MiniMax M3 أوزانها المفتوحة في نحو 10 يونيو 2026، مما يُتيح النشر المحلي على البنية التحتية الخاصة. وبالنسبة للمطورين الذين يعالجون أحمال عمل حساسة، يُلغي الاستضافة الذاتية تماماً مخاوف توجيه البيانات مع الإبقاء على الميزة السعرية.
ما يجب على مشتري الذكاء الاصطناعي الإنتاجي فعله
حرب تكاليف الاستدلال حقيقية، لكنها ليست قراراً بسيطاً “للتحوّل إلى النموذج الأرخص”. يختلف حساب المخاطر اختلافاً جوهرياً بحسب نوع البيانات وحمل العمل والاختصاص القضائي التنظيمي.
1. صنّفوا أحمال عملكم حسب حساسية البيانات قبل اختيار النماذج
الإجراء الأول هو التصنيف لا الشراء. تنقسم أحمال العمل إلى ثلاثة مستويات: (أ) حوسبة غير حساسة — توليد كود على مستودعات مفتوحة المصدر، تلخيص بيانات عامة، مهام إبداعية بلا بيانات شخصية؛ (ب) بيانات داخلية حساسة — سجلات العملاء والمعاملات المالية وبيانات الموظفين؛ (ج) بيانات خاضعة للتنظيم — أي شيء يخضع للائحة GDPR أو HIPAA أو PCI-DSS أو لوائح قطاعية. تُعدّ واجهات API الصينية المستضافة قابلة للاستخدام للمستوى (أ) اليوم مع ضمانات تعاقدية مناسبة. أما للمستوى (ب) فهي عالية المخاطر، وللمستوى (ج) محظورة فعلياً ما لم تكن مستضافة ذاتياً. يُشير إطار الامتثال الصادر عن RedHub.ai إلى أن القانون الصيني قد يُلزم الإفصاح عن بيانات طلبات الاستدلال للسلطات بضمانات إجراءات قانونية محدودة — مخاطرة تعاقدية لا تعالجها اتفاقيات مستوى الخدمة القياسية.
2. ادرجوا تكاليف الاستضافة الذاتية في النموذج المالي لا كاعتبار ثانوي
يتضيّق الفارق السعري بمقدار 20 إلى 100 ضعف عند احتساب البنية التحتية اللازمة للاستضافة الذاتية. لكن لأحمال العمل من المستويين (ب) و(ج)، الاستضافة الذاتية ليست خياراً بل ضرورة — إنها الضبط الوحيد الذي يُلغي عبور البيانات عبر الحدود. للمنظمات التي تمتلك بنية تحتية GPU، يظل إضافة DeepSeek V4-Flash بـ0.28 دولار لرموز الإخراج (أو أقل على الأجهزة الخاصة) مقنعاً اقتصادياً مقارنةً بـ30 دولاراً لـGPT-5.5 حتى بعد تكاليف الاستضافة. للفرق التي لا تمتلك بنية GPU، تبرز طبقات الاستضافة المدارة مثل AWS Bedrock خياراً وسطاً — تُوجّه الاستدلال داخل اختصاص قضائي غربي مع الوصول إلى أوزان النماذج الصينية.
3. دقّقوا في مكدّس التطوير لديكم للكشف عن التبني الصامت للنماذج الصينية
يتّسم تبنّي الذكاء الاصطناعي في المؤسسات بالتشعّب: قد يوافق قسم تقنية المعلومات المركزي على مزوّد بعينه، بينما تتبنّى فرق المنتج خفيةً بدائل أرخص عبر مفاتيح API يتحكّم فيها المطورون. يُشير معدل التبني البالغ 80% لدى الشركات الناشئة في الذكاء الاصطناعي إلى أن هذا النمط موجود بالفعل داخل كثير من المنظمات الأكبر. أجروا تدقيقاً في إنفاق API وتدفقات البيانات الصادرة وتهيئة سلاسل أدوات المطورين لتحديد النماذج التي تعالج فعلياً بيانات الإنتاج. لا ينتظر هذا التحقق حتى تقع مشكلة — جرد ربعي لاستخدام النماذج بات مكوّناً معيارياً لحوكمة الذكاء الاصطناعي.
4. قيّموا الأداء وفق حمل عملكم تحديداً لا وفق قوائم التصنيف العامة
Arena Elo وSWE-bench Verified إشارات مفيدة لكنها لا تعكس بالضرورة أداء تطبيقكم المحدد. نموذج يُسجّل 80.2% على SWE-bench قد يُؤدّي بشكل مختلف كلياً على كود متخصص (برمجيات طبية، حسابات مالية، أنظمة مدمجة). قبل الالتزام بنموذج صيني مفتوح الأوزان في مسار حرج، أجروا تقييماً منظماً على 50 إلى 100 مثال تمثيلي من حمل عملكم الفعلي. الفجوة في المعايير ضيقة بما يكفي لأن تذهب النتيجة في أي اتجاه — لكنكم بحاجة إلى بياناتكم الخاصة لا إلى متوسط الصناعة.
الدرس الهيكلي: التكلفة كهادم للميزة التنافسية
حرب تكاليف الاستدلال هادمة للميزة التنافسية لمنصات الذكاء الاصطناعي الغربية المهيمنة بطريقة لم تكن جودة النماذج وحدها لتُحدثها أبداً. بنى كل من OpenAI وAnthropic ميزتهما الدفاعية على القدرة: كانا أفضل بشكل قابل للقياس، وكان المشترون من المؤسسات يدفعون علاوة مقابل ذلك. تمحو تعادلية التكاليف هذا المنطق. حين يوجد فارق سعري بمقدار 10 إلى 100 ضعف مع فجوة أداء أقل من 5%، يكفّ فارق الأداء عن كونه متغيّر القرار.
ما يحتفظ به المهيمنون هو البنية التحتية للثقة: سجلات التدقيق، وشهادات الامتثال، والضمانات التعاقدية لمعالجة البيانات، ووضوح الاختصاص القضائي القانوني، وأهلية عقود القطاع الحكومي. في القطاعات الخاضعة للتنظيم والمشتريات العامة، هذه البنية التحتية للثقة غير قابلة للتفاوض، والنماذج الصينية مفتوحة الأوزان — حتى المستضافة ذاتياً — تواجه تدقيقاً في مصدر سلسلة التوريد وقانونية بيانات التدريب وفق اللائحة الأوروبية، وكذلك مخاوف امتثال محتملة للعقوبات.
ينقسم السوق إذن إلى شريحتين: الأدوات التطويرية واستدلال الشركات الناشئة وأحمال العمل المؤسسية غير الحساسة تتحوّل نحو النماذج الصينية مفتوحة الأوزان المُحسَّنة تكلفةً بمعدلات لم تكن متوقعة قبل اثني عشر شهراً. بينما سيتمركز ذكاء الأعمال المنظَّم والدفاع والصحة والحكومة حول مزودين غربيين بمكدّسات امتثال مُعتمَدة — وستدفع أسعاراً مرتفعة مقابل تلك الضمانة.
الأسئلة الشائعة
لماذا تكون النماذج الصينية مفتوحة الأوزان أرخص بكثير من نظيراتها الغربية؟
تستفيد المختبرات الصينية من تكاليف تشغيلية أدنى وإمكانية وصول إلى الحوسبة بدعم حكومي، فضلاً عن هندسة mixture-of-experts (MoE) التي لا تُنشّط سوى جزء من إجمالي المعاملات في كل مسار استدلال — إذ يستخدم DeepSeek V4-Flash 13 مليار معامل فقط من أصل 284 ملياراً، مما يُخفّض تكلفة الحوسبة جذرياً. كما يُلغي الترخيص مفتوح الأوزان الحاجة إلى استرداد تكاليف تدريب النماذج من خلال هوامش واجهات API، فيتّجه التسعير نحو اقتصاديات الحوسبة الخام. والنتيجة: DeepSeek V4-Flash بـ0.28 دولار لكل مليون رمز إخراج مقابل 30.00 دولاراً لـGPT-5.5 — فارق بمقدار 107 أضعاف.
ما المخاطر الحقيقية للبيانات عند استخدام واجهات API صينية للذكاء الاصطناعي المستضافة؟
المخاطرة الرئيسية هي توجيه البيانات عبر خوادم خاضعة للاختصاص القضائي الصيني، المُلزَم بالقانون الصيني بما في ذلك متطلبات الوصول الحكومي المحتمل للبيانات مع حماية إجرائية محدودة. هذا يُفرز تعرّضاً لأحمال العمل التي تتضمن بيانات شخصية قابلة للتعريف أو بيانات مالية أو سجلات صحية أو أي بيانات تخضع للائحة GDPR أو HIPAA أو أطر مماثلة. يُلغى هذا الخطر فعلياً باستضافة النماذج مفتوحة الأوزان ذاتياً على بنية تحتية خارج الاختصاص القضائي الصيني، أو باستخدام طبقات غربية المضيف مثل AWS Bedrock التي تُقدّم أوزان النماذج الصينية ضمن اختصاص قضائي متوافق.
كيف تتنافس النماذج الصينية في معايير البرمجة مع GPT-5.5 أو Claude Sonnet؟
على SWE-Bench Verified — أكثر معايير البرمجة الواقعية صرامةً — سجّل MiniMax M2.5 نسبة 80.2% مقابل 80.8% لـClaude Opus 4.6، فارق 0.6 نقطة مئوية. كما أن DeepSeek V4-Flash لا يبعد سوى 1.6 نقطة مئوية عن نظيره الأغلى V4-Pro في مهام البرمجة. على Arena Elo في مايو 2026، سجّلت أفضل النماذج الصينية 1,449 مقابل نطاق 1,481 إلى 1,503 للنماذج الغربية الرائدة. للبرمجة العامة وتوليد المحتوى والتلخيص، الفجوة ضئيلة وظيفياً بجزء بسيط من السعر. أما للتفكير المتعدد الخطوات المعقد والمهام العلمية المتخصصة، تحتفظ النماذج الغربية الرائدة بتفوق قابل للقياس.
المصادر والقراءات الإضافية
- والقراءات الإضافية
- النماذج الصينية تُحقق 61% من حصة السوق على OpenRouter — Dataconomy
- أكثر شركات نماذج الذكاء الاصطناعي شعبيةً على OpenRouter في يونيو 2026 — OfficeChai
- النماذج الصينية تتفوق على المنافسين الأمريكيين في استهلاك الرموز العالمي — TrendingTopics.eu
- كيف فتح DeepSeek V4-Flash الطريق في قوائم الاستخدام العالمية — PBX Science
- Qwen 3.7 Max مقابل MiniMax M3 — AIMadeTools
- الذكاء الاصطناعي الصيني والامتثال: إطار المخاطر للشركات — RedHub.ai
- الشركات الأمريكية الناشئة تُحوّل حركتها بهدوء إلى نماذج LLM الصينية — Crypto Briefing
- 4 نماذج صينية مفتوحة الأوزان في 12 يوماً: حرب تكاليف الاستدلال تتسارع — abhs.in




