خزانة واحدة بقوة حوسبة تفوق مراكز بيانات بأكملها
يمثل GB300 NVL72 من NVIDIA أكثر عمليات توحيد حوسبة الذكاء الاصطناعي طموحاً على الإطلاق. تدمج خزانة واحدة 72 وحدة Blackwell Ultra GPU و36 وحدة معالجة مركزية Grace القائمة على معمارية Arm في وحدة مبردة بالكامل بالسوائل، تقدم 1,440 بيتافلوبس (1.44 إكسافلوبس) من أداء FP4 Tensor Core. للتوضيح، كان الحاسوب الفائق Summit بأكمله، الذي كان أسرع آلة في العالم عام 2018، يقدم 200 بيتافلوبس.
يربط النظام جميع وحدات GPU الـ 72 عبر نسيج NVLink Switch من الجيل الخامس، موفراً 130 تيرابايت/ثانية من عرض النطاق الترددي الشامل داخل الخزانة. يحصل كل GPU على 1.8 تيرابايت/ثانية من عرض نطاق NVLink و288 جيجابايت من ذاكرة HBM3e، مما يمنح الخزانة الكاملة 37 تيرابايت من الذاكرة السريعة. يتيح ذلك للنماذج ذات البليون معامل أن تعمل بالكامل ضمن نطاق خزانة واحدة، مما يلغي عبء الاتصال بين الخزائن الذي شكّل تاريخياً عنق الزجاجة في تدريب النماذج الكبيرة.
ما الذي تغير من GB200 إلى GB300
يخلف GB300 NVL72 سلفه GB200 NVL72 بترقيات جوهرية على كل صعيد. ارتفعت الذاكرة لكل GPU من حوالي 192 جيجابايت إلى 288 جيجابايت من HBM3e. تضاعف تسريع الانتباه، مما يفيد مباشرةً أحمال عمل المحولات (Transformer). تدعي NVIDIA تحسناً في الأداء بمقدار الضعف تقريباً في مهام تدريب النماذج اللغوية الكبيرة مقارنة بـ GB200، مع مكاسب أكبر في الاستدلال من خلال التنفيذ المحسن لـ FP4 وFP8.
ارتفع استهلاك الطاقة بشكل معتدل، من حوالي 120 كيلوواط لكل خزانة في GB200 إلى 132-140 كيلوواط لـ GB300، مع ذروات تصل إلى 155 كيلوواط حسب حمل العمل. تحسنت نسبة الأداء لكل واط بشكل ملحوظ رغم ارتفاع الاستهلاك المطلق.
أضافت معمارية Blackwell Ultra أيضاً دعماً أصلياً لأحمال العمل المكثفة في الاستدلال المنطقي. صممت NVIDIA الـ GB300 خصيصاً للتحول من الاستدلال البسيط القائم على السؤال والجواب إلى الذكاء الاصطناعي الوكيل متعدد الخطوات، حيث تسلسل النماذج عدة مراحل من الاستدلال قبل إنتاج النتيجة.
إعلان
التبريد بالسوائل: ضرورة حتمية
يُشحن كل GB300 NVL72 كنظام مبرد بالكامل بالسوائل. لا يوجد خيار للتبريد بالهواء. تستخدم الخزانة معمارية هجينة حيث تتلقى وحدات GPU وCPU ومكونات NVSwitch تبريداً سائلاً مباشراً على الشريحة، بينما تُبرد وحدات OSFP ومحركات التخزين بالهواء. يذهب ما يقرب من 90% من الحرارة إلى السائل و10% إلى الهواء.
تؤكد NVIDIA أن نظام التبريد بالسوائل أكثر كفاءة في استهلاك الطاقة بـ 25 مرة وأكثر كفاءة في استهلاك المياه بـ 300 مرة مقارنة بالتبريد التقليدي بالهواء. ولأن سائل التبريد يدور في حلقة مغلقة، لا يتبخر أي ماء أثناء التشغيل. لمركز بيانات ضخم بقدرة 50 ميغاواط، تقدر NVIDIA التوفير السنوي بأكثر من 4 ملايين دولار من مكاسب كفاءة التبريد وحدها.
يفرض هذا الخيار التصميمي على صناعة مراكز البيانات تحولاً جيلياً. لا يمكن للمنشآت المبنية للتبريد بالهواء استضافة خزائن GB300 دون إعادة تأهيل، مما يخلق عنق زجاجة في مواقع النشر المتاحة حتى مع ارتفاع الطلب.
من يبني باستخدام GB300
نشرت Microsoft أول مجمع إنتاجي واسع النطاق، بدمج أكثر من 4,600 خزانة GB300 NVL72 متصلة عبر شبكة InfiniBand من NVIDIA لأحمال عمل OpenAI. كانت CoreWeave أول مزود سحابي يقدم نسخ GB300 NVL72، تلتها AWS مع EC2 P6e-GB300 UltraServers.
أطلقت كل من HPE وLenovo وSupermicro تكويناتها الخاصة لـ GB300 NVL72. تتراوح أسعار السحابة من 2.90 دولار في الساعة للنسخ الفورية إلى 18 دولاراً في الساعة لكل GPU عند الطلب. يُقدر سعر شراء الخزانة الكاملة بأكثر من 5 ملايين دولار، بينما تبدأ محطة عمل DGX Station المكتبية من NVIDIA بحوالي 275,000 دولار.
تكشف قاعدة العملاء أين يتركز الطلب على حوسبة الذكاء الاصطناعي. يشتري مشغلو السحابة الكبار آلاف الخزائن لتدريب النماذج التأسيسية. تقيّم المؤسسات تكوينات DGX للاستدلال في مقراتها. يتسابق مزودو السحابة لتقديم نسخ GB300 قبل منافسيهم، مما يخلق ضغطاً على سلسلة التوريد يمتد من قدرة تصنيع TSMC حتى مزودي البنية التحتية للتبريد بالسوائل.
فجوة البنية التحتية تتسع
يبلور GB300 NVL72 فجوة متنامية في صناعة الذكاء الاصطناعي. المؤسسات التي تملك الوصول إلى هذه الأنظمة يمكنها تدريب ونشر نماذج بأحجام كانت مستحيلة فيزيائياً قبل عامين. أما تلك التي لا تملك الوصول فتزداد اعتماداً على مزودي واجهات برمجة التطبيقات الذين يشغلون هذه الخزائن.
يعني متطلب 140 كيلوواط لكل خزانة أن نشراً متواضعاً من 100 خزانة يستهلك 14 ميغاواط، أي ما يعادل الحمل الكهربائي لبلدة صغيرة. تُقصي ضرورة التبريد بالسوائل معظم منشآت مراكز البيانات الحالية. والتكلفة المقدرة بـ 500 مليون دولار لمجمع من 100 خزانة تضع الملكية المباشرة بعيداً عن متناول الجميع باستثناء أكبر شركات التكنولوجيا وصناديق الثروة السيادية.
بالنسبة لمنظومة الذكاء الاصطناعي الأوسع، يمثل GB300 قفزة في القدرات ومخاطر تركز في آن واحد. البنية التحتية الأقوى للذكاء الاصطناعي تتوحد في أيدٍ أقل، في منشآت تتطلب بنية تحتية مخصصة للطاقة والتبريد يستغرق بناؤها سنوات.
الأسئلة الشائعة
ما الذي يميز NVIDIA GB300 NVL72 عن مجمعات GPU السابقة؟
يدمج GB300 NVL72 72 وحدة Blackwell Ultra GPU في خزانة واحدة مبردة بالسوائل تقدم 1.44 إكسافلوبس من أداء FP4 و37 تيرابايت من الذاكرة السريعة. يتيح عرض نطاق NVLink البالغ 130 تيرابايت/ثانية للنماذج ذات البليون معامل العمل ضمن خزانة واحدة، مما يلغي عنق زجاجة الاتصال بين الخزائن الذي كان يبطئ الأنظمة السابقة بنسبة تصل إلى 40%.
كم يكلف خزانة GB300 NVL72؟
تضع تقديرات الصناعة سعر GB300 NVL72 فوق 5 ملايين دولار لكل خزانة. الوصول السحابي أقل تكلفة، مع نسخ فورية تبدأ من 2.90 دولار لكل GPU في الساعة وأسعار عند الطلب تصل إلى 18 دولاراً لكل GPU في الساعة. تبدأ محطة DGX Station من NVIDIA بحوالي 275,000 دولار للمؤسسات الراغبة في حوسبة ذكاء اصطناعي محلية دون نشر خزانة كاملة.
لماذا يتطلب GB300 تبريداً بالسوائل وماذا يعني ذلك لمراكز البيانات؟
تستهلك كل خزانة GB300 NVL72 132-140 كيلوواط من الطاقة، وهو ما يتجاوز بكثير ما يمكن للتبريد بالهواء التعامل معه بكفاءة. يلتقط التبريد السائل المباشر على الشريحة من NVIDIA 90% من الحرارة عبر السائل، محققاً كفاءة مائية أفضل بـ 300 مرة من التبريد التقليدي. تفرض هذه الضرورة على مراكز البيانات إعادة التأهيل أو بناء منشآت جديدة، مما يخلق عنق زجاجة مؤقتاً في مواقع النشر المتاحة.
المصادر والقراءات الإضافية
- NVIDIA GB300 NVL72 Product Page — NVIDIA
- NVIDIA GB300 NVL72 on Azure — Microsoft Azure Blog
- Microsoft Azure Unveils World’s First GB300 NVL72 Cluster for OpenAI — NVIDIA Blog
- Blackwell Platform Water Efficiency — NVIDIA Blog
- How Much Power Does a GB300 NVL72 Need — Sunbird DCIM
- NVIDIA B300 Blackwell Ultra Specs and Pricing — Spheron






