النقطة العمياء للـ GPU التي تحلها IPU
اقتصرت محادثة بنية تحتية الذكاء الاصطناعي في 2023 و2024 تقريباً كلياً على وحدات GPU: من لديه أكثر H100، وكم سرعة توفّر الجيل التالي من Blackwell، وبأي معدل ينخفض السعر لكل ساعة GPU. لم يكن هذا التأطير خاطئاً — فإمكانية حوسبة GPU كانت القيد الرئيسي لتدريب الذكاء الاصطناعي. لكنه أوجد نقطة عمياء: مع انتقال أعباء عمل الذكاء الاصطناعي من التدريب نحو الاستدلال والتنسيق وعمليات الخدمة، ينتقل الاختناق إلى أسفل في المنظومة.
رف استدلال ذكاء اصطناعي يشغّل 8 وحدات GPU بالاستخدام الكامل يستهلك كمية هائلة من طاقة المعالج المركزي للشبكات — إدارة حركة المرور الواردة والصادرة، وتطبيق سياسات التخزين، ومعالجة التشفير، وتنسيق عزل المستأجرين. هذه ليست مهام حوسبة للذكاء الاصطناعي؛ إنها عمل سباكة البنية التحتية. على الخادم المعياري، يتعامل المعالج المركزي المضيف مع كل هذا. على نطاق واسع، يعني هذا أن 20 إلى 30% من طاقة المعالج المركزي في رف ذكاء اصطناعي فائق الحجم قد تُستهلك في تكاليف بنية تحتية ليس لها علاقة بتشغيل استدلال النماذج.
وحدات معالجة البنية التحتية من Intel هي رقائق ASIC مخصصة مصمّمة لاستيعاب تكاليف البنية التحتية هذه. تجلس IPU بين المعالج المركزي والنسيج الشبكي، تعالج التحكم في الشبكة وإدارة التخزين وتطبيق الأمن باستقلالية عن المعالج المركزي المضيف. النتيجة: يستعيد المعالج المركزي تلك الـ 20 إلى 30% من الدورات لأعباء التطبيقات، وتعمل وظائف البنية التحتية بأداء أكثر قابلية للتنبؤ لأنها لم تعد تتنافس مع كود التطبيق على وقت المعالج المركزي.
هذا هو نفس المنطق المعماري الذي تتبعه وحدات DPU من NVIDIA (BlueField) وMarvell (LiquidIO). ميزة Intel هي في عمق تكاملها مع Xeon وعلاقتها الطويلة مع Google Cloud. تصف إعلان 9 أبريل 2026 تعاوناً متعدد السنوات يعزز دور «وحدات المعالجة المركزية وIPU المخصصة في توسيع نطاق أنظمة الذكاء الاصطناعي الهجينة الحديثة».
لماذا يهم التوقيت لقرارات معمارية السحابة
التحول من أعباء عمل الذكاء الاصطناعي المُركَّزة على التدريب نحو الاستدلال جارٍ بالفعل. تدريب نموذج أساسي يحدث مرة واحدة (أو نادراً). خدمة ذلك النموذج على نطاق الإنتاج تحدث ملايين المرات يومياً. الاستدلال حساس للزمن، مُطالِب بالإنتاجية، ومُوازٍ بشكل مكثف — يُجهد الشبكة والذاكرة الفرعية للخادم أكثر بكثير من التدريب. عبء معالجة البنية التحتية الذي تعالجه IPU يتناسب خطياً مع إنتاجية الاستدلال.
تحليل The Register للصفقة بين Google وIntel يلاحظ أن Google تستعين بـ Intel «لجولة أخرى من رقائق الشبكة المخصصة»، مع التأكيد على بُعد السيليكون المخصص: هذه ليست مكونات جاهزة بل ASICs مطوّرة مشتركاً مصمّمة حول ملامح أعباء عمل Google Cloud الخاصة. هذا المستوى من التخصيص ينتج أداءً أفضل لكل واط لأنماط حركة بيانات Google بالضبط — لكنه يعني أيضاً أن البنية المعمارية مندمجة عمقاً في بنية تحتية Google Cloud بطرق يحتاج مزودو السحابة الآخرون لتكرارها بشراكات سيليكون خاصة بهم.
تستخدم Microsoft Azure شبكات SmartNICs قائمة على FPGA (برنامج Catapult/Azure Boost). لدى AWS نظام Nitro — نظام تفريغ بنية تحتية مخصص يُشغّل EC2 منذ 2017 ويمثل ربما التطبيق الأكثر نضجاً للمفهوم. برنامج IPU من Google مع Intel يلحق بالفلسفة المعمارية لـ Nitro مع استخدام شريك سيليكون مختلف. الديناميكية التنافسية تسرّع الابتكار: كل hyperscaler يستثمر الآن في سيليكون مخصص لتفريغ البنية التحتية، مما يعني أن تكلفة الوحدة من رقائق فئة IPU ستنخفض مع نمو أحجام الإنتاج.
إعلان
ما يجب على مهندسي البنية التحتية ومشتري السحابة فعله
1. إعطاء الأولوية لأنواع النسخ المدعومة بـ IPU لأعباء الاستدلال الحساسة للزمن
تعمل عائلتا النسخ C4 وN4 من Google Cloud على Intel Xeon 6 مع تفريغ IPU. بالنسبة للمؤسسات التي تنشر نقاط نهاية استدلال الذكاء الاصطناعي — خدمة النماذج وتوليد التضمينات وخطوط معالجة RAG — توفر هذه النسخ زمن استجابة أكثر اتساقاً وأقل تبايناً مقارنةً بالنسخ المعادلة للحوسبة دون تفريغ IPU، لأن المعالج المركزي المضيف لا يتنافس مع معالجة الشبكة على نفس موارد التنفيذ.
الاختبار العملي هو مقارنة الكمّيات في زمن الاستجابة، لا متوسط الزمن. يُقلّص تفريغ IPU عادةً زمن الاستجابة P99 (أسوأ 1% من أوقات الاستجابة) أكثر مما يُقلّص P50 (الوسيط)، لأن أسوأ ذروات زمن الاستجابة في النسخ غير المُجهّزة بـ IPU تأتي من تصادمات جدولة المعالج المركزي بين كود التطبيق ومعالجة البنية التحتية. للتطبيقات التي يهم فيها زمن الاستجابة المتأخر — منتجات الذكاء الاصطناعي للعملاء وأنظمة التوصيات الفورية وبنية التداول — فإن تحسين P99 هو المقياس الذي يُبرر علاوة نوع النسخة.
2. فهم تكافؤ AWS Nitro عند مقارنة البنى متعددة السحاب
يوفر AWS Nitro تفريغ البنية التحتية منذ 2017 عبر جميع عائلات نسخ EC2 الحديثة. عند مقارنة نسخ Google Cloud المدعومة بـ IPU مقابل ما يعادلها في AWS، يجب على المهندسين المقارنة مع عائلات النسخ المُجهّزة بـ Nitro — لا مع أجيال EC2 القديمة التي سبقت Nitro. المعمارية تتقارب الآن: يستخدم جميع الـ hyperscalers الثلاثة الرئيسيين شكلاً من أشكال سيليكون تفريغ البنية التحتية، مما يعني أن نقطة المقارنة لأعباء العمل المؤسسية هي جودة التطبيق، لا وجود التفريغ أو غيابه.
الإعلان Intel-Google الذي غطّته Tom’s Hardware يُلاحظ أن الصفقة متعددة السنوات تشمل أيضاً توافق خارطة طريق Xeon من Intel مع متطلبات الحوسبة في Google — مما يعني أن فجوة الأداء بين نسخ Google Cloud المُجهّزة بـ Xeon وأنواع النسخ المنافسة من المرجح أن تضيق مع نضج إنتاج Xeon 6.
3. تقييم قرارات تجديد البنية التحتية المحلية من خلال منظار IPU
بالنسبة للمؤسسات ذات البنية التحتية المحلية الكبيرة — المؤسسات المالية وشركات الاتصالات وشركات الطاقة — تُعدّ صفقة Intel-Google على IPU إشارةً على أن دورة تجديد الخوادم القادمة يجب أن تُقيّم التكوينات القادرة على IPU بدلاً من الاكتفاء بالخوادم المعيارية ذات المعالجَين Xeon. تُدخل منصة Intel SmartEdge Agile وأجهزة التكيّف Ethernet 800 Series تفريغ الشبكة من فئة IPU إلى عمليات النشر المحلية دون الحاجة لهجرة سحابية. نفس تحرير دورات المعالج المركزي الذي تحققه Google Cloud على أرفف الاستدلال متاح للمؤسسات التي تشغّل بنية تحتية استدلال ذكاء اصطناعي خاصة.
حجة الأعمال لاعتماد IPU محلياً في 2026 الأقوى للمنظمات التي تشغّل استدلالاً عالي الإنتاجية أو أحمال قواعد بيانات على خوادم Linux حيث يُعرَّف تشبع معالجة الشبكة بوصفه اختناقاً. قرار توسيع السعة الذي يدرس بالفعل أجهزة خوادم جديدة يجب أن يتضمن NIC المتوافق مع IPU كبند ميزانية، لأن تحسين الحوسبة مقابل الدولار الناتج عن تفريغ 20 إلى 30% من دورات المعالج المركزي يُعادل إضافة نحو 25% نوى إضافية لأعباء التطبيقات دون إضافة معالجات.
مسألة احتكار السوق
يطرح التعاون بين Intel وGoogle سؤالاً هيكلياً يجب على مهندسي البنية التحتية في المؤسسات مراعاته. شراكات السيليكون المخصصة بين hyperscalers ومصنّعي الرقائق تُنشئ بنية تحتية مُحسَّنة، بتصميمها، لملف أعباء عمل مزود سحابة واحد بالضبط. ستؤدي نسخ Google Cloud التي تشغّل وحدات Intel IPU المخصصة بشكل أفضل على Google Cloud مقارنةً بنفس معالجات Intel Xeon التي تعمل ببرامج ثابتة عامة في مكان آخر. هذا جيد لأداء Google Cloud لكنه يرفع تكلفة الانتقال للمؤسسات التي تُحسّن بنيتها حول سلوك البنية التحتية الخاص بـ Google Cloud.
Nitro من AWS وبرنامج FPGA من Microsoft وشراكة Intel IPU من Google كلها تُنشئ خنادق بنية تحتية متمايزة. مهندسو السحابة المؤسسيون الذين يفهمون هذه الخنادق يستطيعون اتخاذ قرارات أكثر استنارة حول تحديد موقع أعباء العمل — والأهم، حول متى تُبرر ميزة الأداء لسيليكون hyperscaler محدد تكلفة قابلية النقل المترتبة على البناء بعمق حول تلك البنية التحتية.
الأسئلة الشائعة
كيف ينبغي للمؤسسات الجزائرية تقييم ما إذا كانت ستبني بنية تحتية محلية أم تستفيد من خدمات السحابة؟
يجب أن تقوم قرارات البناء مقابل الشراء في مجال البنية التحتية على متطلبات سيادة البيانات وخصائص أعباء العمل والتكلفة الإجمالية للملكية على أفق 5 سنوات. بالنسبة لمعظم المؤسسات الجزائرية، النهج الهجين — الاحتفاظ بالبيانات الحساسة محلياً مع استخدام السحابة للأحمال القابلة للتوسع — يوفر أفضل توازن.
ما هو الجدول الزمني الواقعي لتضييق الجزائر الفجوة في البنية التحتية مع نظيراتها الإقليمية؟
يشير مسار الاستثمار الحالي إلى جدول زمني من 5 إلى 7 سنوات لبلوغ الجزائر مستوى مماثل من توفر خدمات السحابة للمؤسسات، مع افتراض استمرار الاستثمار في اتصالية الكابلات البحرية وسعة مراكز البيانات المحلية.
أي تقنيات البنية التحتية المذكورة هنا يمكن للمنظمات الجزائرية اعتمادها فوراً مقابل تلك التي تتطلب فترات إعداد طويلة؟
الشبكات المُعرَّفة بالبرمجيات والحاويات وهياكل التطبيقات السحابية الأصيلة يمكن اعتمادها فوراً بالمواهب الحالية وتوافر خدمات السحابة الحالية. بنية مراكز البيانات الضخمة وشبكات الحوسبة الطرفية المتقدمة والبنية التحتية للكابلات البحرية تتطلب تخطيطاً متعدد السنوات.
المصادر والقراءات الإضافية
- Intel وGoogle يعمّقان التعاون لتطوير بنية تحتية الذكاء الاصطناعي — Intel Newsroom
- Intel وGoogle يعلنان صفقة رقائق متعددة السنوات — Tom’s Hardware
- Google تستعين بـ Intel لجولة أخرى من رقائق الشبكة المخصصة — The Register
- وحدة معالجة البنية التحتية من Intel — صفحة منتجات Intel
- تقديم أجهزة C3 مع IPU Intel المخصص من Google — مدونة Google Cloud
- نظام AWS Nitro — Amazon Web Services



