⚡ أبرز النقاط

تمثل استدلالات الذكاء الاصطناعي بالفعل نصف إجمالي حوسبة الذكاء الاصطناعي في 2025 (Deloitte) وستصل إلى ثلثين بنهاية 2026. يتوقع Lenovo انعكاساً نهائياً إلى 20/80 مقارنة بالنسبة الحالية 80/20 للتدريب/الاستدلال. الاستثمار العالمي اللازم لمراكز البيانات بحلول 2030 نحو 3 تريليون دولار.

الخلاصة: يجب على المدراء التقنيين للمؤسسات مراجعة تقسيم تكاليف التدريب/الاستدلال، وتقييم أجهزة الاستدلال المتخصصة قبل تجديد عقود وحدات GPU، وبناء طوبولوجيا استدلال إقليمية لخفض تكاليف الخدمة بنسبة 30-70%.

اقرأ التحليل الكامل ↓

🧭 رادار القرار

الأهمية بالنسبة للجزائر
متوسط

مع نشر المؤسسات الجزائرية لتطبيقات الذكاء الاصطناعي (على AventureCloudz أو AWS أو Azure)، تُعدّ إدارة تكاليف الاستدلال ومعمارية الزمن قابلةً للتطبيق مباشرةً؛ يقدّم المقال توجيهات قابلة للتنفيذ لأي نشر للذكاء الاصطناعي على نطاق واسع.
البنية التحتية جاهزة؟
جزئي

تمتلك الجزائر وصولاً سحابياً عبر AventureCloudz والمزودين الدوليين، لكنها تفتقر إلى أجهزة GPU محلية مُحسَّنة للاستدلال أو عقد استدلال طرفية — إذ تُوجَّه تطبيقات الذكاء الاصطناعي الجزائرية التي تخدم المستخدمين المحليين عبر مراكز بيانات أوروبية أو أمريكية.
المهارات متوفرة؟
جزئي

يبني المطوّرون الجزائريون تطبيقات الذكاء الاصطناعي، غير أن مهارات معمارية البنية التحتية للتعلم الآلي — تحديداً خدمة الاستدلال وتحجيم النماذج وتحسين التكلفة لكل رمز — لا تزال في طور النضج في سوق المواهب المحلي.
الجدول الزمني للعمل
6-12 شهراً

ينبغي للمؤسسات الجزائرية التي تنشر منتجات ذكاء اصطناعي في الإنتاج مراجعة تقسيم تكاليف الاستدلال الآن — فوفورات التكاليف الناجمة عن تحسين الأجهزة والمزودين متاحة بموجب العقود السحابية الحالية.
أصحاب المصلحة الرئيسيون
DSI، ومهندسو التعلم الآلي، ومهندسو الحلول السحابية، والمؤسسون التقنيون للشركات الناشئة، ومديرو تقنية المعلومات في المؤسسات
نوع القرار
تكتيكي

الإجراءات الأربعة الموصوفة (مراجعة التكاليف، وتقييم الأجهزة، والطوبولوجيا الإقليمية، وإعادة التفاوض على التسعير) قابلة للتنفيذ ضمن البنية التحتية الحالية دون تحوّل استراتيجي.

خلاصة سريعة: ينبغي لفرق الذكاء الاصطناعي الجزائرية التي تُشغّل نماذج في الإنتاج مراجعة تقسيم تكاليف التدريب والاستدلال أولاً — إذ يهيمن الاستدلال على تكاليف الذكاء الاصطناعي في معظم الحالات وينمو بوتيرة متسارعة. يمكن للتحسينات المادية والتسعيرية الموصوفة في هذا المقال خفض تكاليف الاستدلال بنسبة 30 إلى 70%، مما يُحرّر ميزانية لتحسين النماذج وتطوير تطبيقات جديدة.

إعلان

اقتصاديات تشغيل الذكاء الاصطناعي مقابل بنائه

تدريب نماذج الذكاء الاصطناعي تكلفة لمرة واحدة: تُنفق الحوسبة وتحصل على النموذج. أما الاستدلال — تشغيل ذلك النموذج في الإنتاج لخدمة المستخدمين الفعليين — فتكلفة متكررة تتنامى مع كل مستخدم جديد وكل استعلام جديد وكل تطبيق جديد. يحدث التدريب مرة واحدة (أو أحياناً للضبط الدقيق). ويستمر الاستدلال إلى الأبد.

وضّح الرئيس التنفيذي لـ Lenovo Yuanqing Yang المسار بصراحة: يذهب اليوم نحو 80% من الإنفاق على الذكاء الاصطناعي للتدريب و20% للاستدلال، وتوقعه أن يُعكس هذا الأمر — 20% للتدريب و80% للاستدلال — مع انتقال نماذج الذكاء الاصطناعي من مرحلة التطوير إلى النشر الإنتاجي الواسع. يُؤيّد تحليل Deloitte لنوفمبر 2025 هذا الاتجاه: مثّلت أحمال الاستدلال نصف إجمالي الحوسبة الذكائية في 2025 ومتوقع أن تبلغ ثلثيها بنهاية 2026.

ذهب تقرير Futurum Group لديسمبر 2025 أبعد من ذلك، متوقعاً أن تتخطى أحمال الاستدلال التدريبَ من حيث الإيرادات في 2026 — أي أن سوق خدمة تطبيقات الذكاء الاصطناعي بات أكبر فعلاً من سوق بنائها.

بحلول 2030، يتوقع تقرير JLL العالمي لمراكز البيانات 2026 أن يُشكّل الذكاء الاصطناعي نصف أحمال عمل مراكز البيانات، مع هيمنة الاستدلال. يبلغ الاحتياج الاستثماري نحو 3 تريليون دولار عالمياً بحلول 2030، يشمل 1.2 تريليون في خلق قيمة الأصول العقارية وما بين 1 و2 تريليون إنفاقاً إضافياً للمستأجرين على البنية التحتية للـ GPU والشبكات.

هذه ليست توقعات عن مستقبل بعيد، بل تصف قرارات معمارية وتخصيصاً رأسمالياً تحتاج فرق البنية التحتية السحابية إلى اتخاذها في 2026.

كيف يختلف الاستدلال عن التدريب معمارياً

يستلزم فهم سبب إجبار الاستدلال على إعادة تصميم البنية التحتية استيعابَ الفارق الجوهري بين سلوك هذين الحملين.

أحمال التدريب مكثّفة بالدُّفعات وغير حساسة للزمن. يمكن جدولة دورة تدريب ليلاً وتشغيلها عبر مجموعة 1000 وحدة GPU في مركز بيانات واحد، وانتظار ساعات أو أياماً للنتيجة دون أن تتأثر تجربة المستخدم. البنية التحتية المثلى: أعلى كثافة GPU، وأعلى عرض نطاق ترابطي بين وحدات GPU (NVLink، InfiniBand)، وأعلى قدرة على توصيل الطاقة (تستهدف الرفوف الآن أكثر من 1 ميغاواط لتدريب النماذج الحدّية)، وموقع مركزي قريب من الطاقة الرخيصة.

أحمال الاستدلال حساسة للزمن وموزّعة جغرافياً. يتوقع المستخدم استجابة من روبوت المحادثة خلال أقل من ثانيتين. نظام ذكاء اصطناعي طبي يقرأ صورة أشعة في مستشفى يحتاج نتائج فورية. سيارة ذاتية القيادة تعالج بيانات الحساسات تحتاج استدلالاً بالمللي ثانية. لهذه الحالات، يُولّد تمركز كل الحوسبة في مركز بيانات واحد في فيرجينيا أو آيوا زمن استجابة غير مقبول للمستخدمين في ساو باولو أو سنغافورة أو الجزائر العاصمة.

التحوّل البنيوي المُضمَّن في ذلك: تتواصل كثافة مجموعات التدريب في الارتفاع عند عدد محدود من الحرم المتفوقة؛ في حين يجب توزيع طاقة الاستدلال نحو مراكز إقليمية وعقد طرفية ونشر محلي بحجم لم يحتجه التدريب قط. تُلاحظ تحليل اتجاهات مراكز البيانات 2026 من IoT Analytics أن أوقات انتظار ربط الشبكة الكهربائية عالية الجهد تتجاوز 6 إلى 8 سنوات في أوروبا — ما يعني أن حرم التدريب المتفوقة الجديدة المرخّصة اليوم لن تُفتتح قبل 2032–2034، فيما يمكن لعقد الاستدلال الموزّعة الأصغر حجماً نشرها في منشآت الاستضافة المشتركة القائمة خلال 18 إلى 24 شهراً.

يُضاعف هذا تباين تكاليف البناء: تُظهر بيانات JLL أن تكاليف البناء ارتفعت إلى 11.3 مليون دولار لكل ميغاواط في 2026 (مقابل 7.7 ملايين في 2020) — معدل نمو مركب سنوي 7% مدفوع بمتطلبات التبريد السائل وتوصيل الطاقة الكثيف وتضخم المواد. عقد الاستدلال بكثافة أقل للرف (10 إلى 50 كيلوواط مقابل 1 ميغاواط+ للتدريب الحدّي) تكلف أقل في البناء ويمكن نشرها في أسواق تنخفض فيها تكاليف الأرض والطاقة.

إعلان

ما ينبغي لـ DSI المؤسسات فعله

لا يمثّل تحوّل البنية التحتية للاستدلال مشكلة مزودي الخدمات الكبرى في المقام الأول — بل مشكلة المؤسسات. كل مؤسسة نشرت نموذج ذكاء اصطناعي خلال الـ 18 شهراً الماضية تكتشف الآن أن تكاليف الاستدلال تنمو أسرع مما توقعته ميزانياتها. القرارات المعمارية المتخذة الآن ستحدد ما إذا كان هذا النمو قابلاً للإدارة أم مُركَّباً.

1. راجعوا التقسيم الحالي لتكاليف أحمال الذكاء الاصطناعي بين التدريب والاستدلال

معظم فرق الذكاء الاصطناعي المؤسسية تتتبع الإنفاق الإجمالي على الذكاء الاصطناعي لكنها لا تتتبع التقسيم بين التدريب والاستدلال. دون هذا التقسيم، يكون تحسين التكاليف أعمى. نفّذوا تمريناً لإسناد التكاليف لمدة 30 يوماً: ما تكاليف السحابة المتعلقة بتدريب النماذج أو ضبطها الدقيق (ساعات GPU × حجم النموذج × دورات التدريب)، وما المتعلق منها بخدمة الاستدلال (مكالمات API × الرموز × مستوى الزمن)؟ بالنسبة للمؤسسات التي أدخلت النماذج إلى الإنتاج، سيُمثّل الاستدلال عادةً 60 إلى 70% من إجمالي الإنفاق على الذكاء الاصطناعي. هذا الرقم، حين يُعرف بدقة، يقود المحادثة الصحيحة حول البنية التحتية مع المزود السحابي.

2. قيّموا الأجهزة المُحسَّنة للاستدلال قبل تجديد عقود GPU

نما سوق الشرائح المتخصصة للاستدلال إلى أكثر من 50 مليار دولار في 2026. على خلاف التدريب الذي يستلزم وحدات GPU الأعلى مستوى (NVIDIA H100/H200/B200 أو ما يعادلها) لتعظيم الإنتاجية، يمكن تشغيل الاستدلال بكفاءة على أجهزة أقل تكلفة مصمَّمة خصيصاً للخدمة: بطاقات NVIDIA السلسلة L، وAMD Instinct MI300X، وشرائح استدلال متخصصة من شركات مثل Groq وCerebras. للمؤسسات التي تدفع أسعار GPU للتدريب من أجل خدمة أحمال الاستدلال، يمكن لاستبدال الأجهزة خفض تكاليف الخدمة بنسبة 40 إلى 70% بإنتاجية مكافئة. لحظات تجديد العقد هي الوقت المناسب لإعادة الهيكلة.

3. ابنوا طوبولوجيا استدلال إقليمية قبل تصاعد شكاوى الزمن

تحتاج تطبيقات الذكاء الاصطناعي المؤسسية التي تخدم مستخدمين في جغرافيات متعددة إلى بنية استدلال إقليمية — لا نقطة واحدة في منطقة سحابية واحدة. التطبيق العملي: نقطة استدلال رئيسية في المنطقة السحابية ذات أكبر تركيز للمستخدمين، ونقطة ثانوية في كل منطقة تضم أكثر من 15% من قاعدة المستخدمين، وخيار استدلال طرفي (باستخدام نماذج محلية أو عقد سحابة طرفية) للحالات الحرجة من حيث الزمن. تكلّف هذه الطوبولوجيا 20 إلى 40% أكثر من نشر أحادي المنطقة وتُقلّص زمن P95 بـ 200 إلى 500 ملي ثانية للمستخدمين خارج المنطقة الرئيسية — وهو مقايضة تُسدَّد عادةً في رضا المستخدمين قبل 12 شهراً.

4. اختبروا ضغط تسعير الاستدلال لدى مزودكم السحابي قبل تجديدات عقود 2027

يمر سوق الاستدلال بضغط سريع على الأسعار تحت وطأة المنافسة بين AWS وAzure وGoogle Cloud والمزودين المتخصصين في الاستدلال (Groq، وFireworks AI، وTogether AI). نمو سوق الشرائح المُحسَّنة للاستدلال إلى ما فوق 50 مليار دولار في 2026 يُخفّض التكاليف لكل مليون رمز. المؤسسات التي أبرمت عقود استدلال في 2024 أو 2025 تدفع على الأرجح أسعاراً أعلى من السوق مقارنةً بأسعار الفور 2026. قبل التجديد، قيسوا تكلفتكم الحالية لكل مليون رمز مقابل ثلاثة مزودين بديلين واستخدموا هذا المعيار كأساس تفاوضي. تُحقَّق تخفيضات تكاليف سنوية بنسبة 30 إلى 50% للمؤسسات الراغبة في تقييم البدائل.

الدرس الهيكلي

لا يمثّل التحوّل نحو الاستدلال مجرد قصة إعادة هيكلة تقنية. إنه تغيير جذري في وظيفة البنية التحتية السحابية. طوال العقد الماضي، كانت “البنية التحتية للذكاء الاصطناعي” تعني التدريب — مجموعات GPU ضخمة وطاقة مركزية وقدرة نماذج حدّية. هذا العصر لا ينتهي، لكنه يتحوّل إلى قطاع متخصص لا حالة الاستخدام المهيمنة.

حالة الاستخدام المهيمنة انطلاقاً من 2026 هي الخدمة: إتاحة النماذج للمستخدمين والتطبيقات والوكلاء التلقائيين بزمن استجابة منخفض وتوافر عالٍ وتكلفة معقولة لكل استعلام. هذه مسألة هندسية مختلفة ومواصفات أجهزة مختلفة وشرط توزيع جغرافي مختلف ونموذج مشتريات مختلف. مزودو السحابة ومشغّلو الاستضافة المشتركة ومورّدو الأجهزة الذين بنوا لعصر التدريب يعيدون هيكلتهم الآن لعصر الاستدلال — والمؤسسات التي تعكس تخطيطها البنيوي هذه الهيكلة ستمتلك ميزة ملموسة في التكاليف والزمن على تلك التي لا تزال تُحسَّن لمعمارية عصر التدريب.

بحلول 2030، يتوقع JLL أن يُمثّل الذكاء الاصطناعي نصف أحمال عمل مراكز البيانات عالمياً مع هيمنة الاستدلال. يتوقع الوصول بطاقة مراكز البيانات العالمية إلى 200 غيغاواط بحلول 2030 بمعدل نمو مركب سنوي 14%. ستتدفق تريليونات الـ 3 المطلوبة لبناء تلك الطاقة بشكل غير متناسب نحو المشغّلين الفاهمين لمتطلبات معمارية الاستدلال — موزَّعة، أقل كثافة، مُحسَّنة للزمن — لا نحو أولئك الذين يبنون ببساطة المزيد مما طلبه عصر التدريب.

تابعوا AlgeriaTech على LinkedIn للتحليلات التقنية المهنية تابعوا على LinkedIn
تابعونا @AlgeriaTechNews على X للحصول على أحدث تحليلات التكنولوجيا تابعنا على X

إعلان

الأسئلة الشائعة

ما الفرق بين تدريب الذكاء الاصطناعي واستدلاله، ولماذا يهم ذلك لتكاليف البنية التحتية؟

التدريب هو عملية بناء نموذج الذكاء الاصطناعي — يستلزم حوسبة GPU ضخمة لساعات أو أيام لكنه يحدث نادراً. الاستدلال هو تشغيل النموذج المدرَّب للإجابة عن الاستعلامات الفعلية — يحدث باستمرار لكل طلب مستخدم وينمو مع الاعتماد. ينتهي المطاف بالاستدلال إلى استهلاك 80 إلى 90% من إجمالي تكلفة الحوسبة على مدى حياة نظام الذكاء الاصطناعي الإنتاجي لأنه لا يتوقف. البنية التحتية المُحسَّنة للتدريب (مجموعات GPU كثيفة، موقع مركزي) مختلفة عن البنية التحتية المثلى للاستدلال (موزّعة، أقل كثافة، أقل زمن).

بأي سرعة تتراجع تكلفة الاستدلال لكل استعلام وهل ستستمر في الانخفاض؟

انخفضت تكاليف الاستدلال لكل مليون رمز بنحو 10 أضعاف بين 2023 و2025 وتواصل الهبوط مع دخول الشرائح المُحسَّنة للاستدلال (بلغ السوق أكثر من 50 مليار دولار في 2026) مرحلة الإنتاج. بحلول 2030، تُشير توقعات Deloitte وJLL إلى أن الاستدلال سيُمثّل ثلثي الحوسبة الذكائية بينما يواصل التكلفة لكل استعلام التراجع — مما يخلق سيناريو “وفرة الاستدلال” حيث تقترب تكاليف استعلامات الذكاء الاصطناعي من الصفر للنماذج المعيارية.

هل ينبغي للمؤسسات الجزائرية بناء بنيتها التحتية للاستدلال الخاصة أم الاعتماد على مزودي السحابة؟

بالنسبة لمعظم المؤسسات الجزائرية، يُعدّ استخدام واجهات API لمزودي السحابة (AWS Bedrock وAzure OpenAI Service وسير عمل الذكاء الاصطناعي في AventureCloudz) نقطة بداية صحيحة — إذ تتجاوز أعباء التشغيل لإدارة البنية التحتية للاستدلال وفورات التكاليف للفرق التي لم تبلغ بعد حجماً كافياً. يبدأ عتبة الاستدلال الذاتي عادةً عند 50,000 إلى 100,000 دولار شهرياً في تكاليف API. دون هذا المستوى، تُقدّم واجهات API المُدارة للاستدلال لدى مزودي السحابة إجمالي تكلفة ملكية أفضل.

المصادر والقراءات الإضافية