ما بنته Microsoft فعلياً: Fairwater بلغة واضحة
في نوفمبر 2025، أعلنت Microsoft الإطلاق التشغيلي لـ Fairwater Atlanta، الحرم الثاني لما تصفه الشركة بـ”مصنع الذكاء الاصطناعي الأول”. يسري اسم Fairwater على كليهما — Wisconsin الأصلي وإضافة Atlanta — وهما حرما مراكز بيانات مادياً منفصلان صمّمتهما Microsoft للعمل كحاسوب عملاق موحد واحد لتدريب الذكاء الاصطناعي.
الابتكار الجوهري لا يكمن في الحرمَين المنفردَين. يضمّ كلاهما أحدث الأجهزة: وحدات GPU NVIDIA Blackwell في أنظمة GB200 NVL72 بمستوى الرف، تُوفّر ما يصل إلى 72 وحدة GPU Blackwell لكل رف مع نحو 1.8 تيرابايت في الثانية من عرض النطاق الترددي GPU-GPU عبر NVLink داخل كل رف. ما يُميّز Fairwater معمارياً هو أسلوب Microsoft في ربط هذين الحرمَين وما يُتيحه هذا الربط.
تبلغ المسافة بينهما نحو 700 ميل. الرابط شبكة ألياف بصرية مخصصة — جزء من بنية ألياف تبلغ 120,000 ميل وسّعتها Microsoft بنسبة 25% في عام واحد. تنتقل الحركة بسرعة تقترب من سرعة الضوء مع حد أدنى من الازدحام لأنها غير مشتركة مع حركة الإنترنت العامة. تُنشئ شبكة AI WAN هذه بنية شبكية ثلاثية الطبقات: NVLink للتواصل بين وحدات GPU داخل الرف، وفابريك Ethernet بسرعة 800 Gbps للتواصل داخل الموقع، والعمود الفقري البصري للتواصل بين المواقع عبر المسافة البالغة 700 ميل.
وفقاً لـإعلان Microsoft الرسمي، انخفضت جداول تدريب النماذج الكبيرة من “عدة أشهر” إلى “أسابيع” بفضل هذه المعمارية الموزعة.
قرارات المعمارية التي تُتيح هذا الإنجاز
تتضمن تصميم Fairwater عدة خيارات هندسية تنحرف انحرافاً ملحوظاً عن الممارسات التقليدية لمراكز البيانات. يهم فهم هذه الخيارات لأنها تمثّل نموذجاً — تصف Microsoft Fairwater بـ”النمط المعماري القابل للتكرار” المُعَدّ للنشر العالمي.
التبريد السائل معياراً أساسياً لا استثناءً. يستخدم موقع Atlanta أنظمة تبريد سائل دائرة مغلقة تستهلك شبه صفر مياه في حالة التشغيل الثابت. هذا انحراف ملحوظ عن تصميم مراكز البيانات المبرّدة هوائياً، ويعكس الواقع الحراري للحوسبة عالية الكثافة: الطاقة الحرارية لتصميم وحدات GPU NVIDIA Blackwell تتجاوز 700 واط لكل شريحة، ورف GB200 NVL72 بـ72 وحدة GPU يُولّد أحمالاً حرارية لا يستطيع التبريد الهوائي إدارتها على نطاق واسع.
معمارية طابقَين لزيادة الكثافة. موقع Atlanta مبنى من طابقَين مع رفوف مرتبة في ثلاثة أبعاد — لا نموذج المستودع أحادي الطابق التقليدي. يزيد ذلك من كثافة الرفوف لكل مساحة أرضية.
مفاتيح تبديل SONiC مع Ethernet العام. تستخدم Microsoft نظام تشغيل الشبكة مفتوح المصدر SONiC على أجهزة Ethernet العامة لمفاتيح الفابريك، متجنّبةً الارتباط بمزوّد محدد. يستخدم الاتصال GPU-GPU بسرعة 800 Gbps عبر فابريك Ethernet عدداً أدنى من القفزات للحد من الكمون.
شبكة AI WAN مخصصة منفصلة عن حركة السحابة العامة. شبكة AI WAN شبكة مخصصة الأغراض تحمل فقط حركة تدريب واستدلال الذكاء الاصطناعي بين مراكز البيانات. هي غير مشتركة مع حركة Azure السحابية للأغراض العامة، مما يُزيل تعارضات الازدحام والأولوية التي ستجعل تدريب الذكاء الاصطناعي متعدد المواقع غير عملي.
إعلان
ما يجب على قادة البنية التحتية المؤسسية استيعابه
Fairwater من Microsoft ليس منتجاً استهلاكياً، وليس تصميم مرجعياً تستطيع معظم المنظمات تكراره مباشرةً. لكن المبادئ المعمارية المُضمَّنة في Fairwater وثيقة الصلة بقرارات تخطيط البنية التحتية المؤسسية المُتخَذة اليوم.
1. نمذجة احتياجات الحوسبة المستقبلية للذكاء الاصطناعي بوصفها موزعة لا مركزية
مجمّع تدريب الذكاء الاصطناعي المركزي يبلغ حدوده العملية على مستوى الطليعة. تصميم Microsoft الموزع استجابة لقيود حقيقية: لا توصيل شبكة كهربائية واحدة يستطيع تزويد الطاقة اللازمة لمجمّع ذكاء اصطناعي في مستوى الطليعة بالحجم الكامل. يجب على فرق البنية التحتية للذكاء الاصطناعي التخطيط للتوسع المستقبلي بافتراض ضرورة التوزيع عبر مواقع متعددة — وأن الشبكة الرابطة بين تلك المواقع بالغة الأهمية كالأجهزة الحسابية ذاتها.
2. معاملة شبكتك بنيةً تحتية للذكاء الاصطناعي لا مجرد اتصالية
شبكة AI WAN هي العنصر الأقل تقديراً في معمارية Fairwater. في تفكير مراكز البيانات التقليدية، الشبكة بنية تحتية تربط الحوسبة بالتخزين. في تدريب الذكاء الاصطناعي الموزع، الشبكة هي المسار الحرج: زيادة 10 ميلي ثانية في كمون التواصل بين وحدات GPU يمكن أن تُخفّض إنتاجية التدريب أكثر مما يبرره الفارق في التكلفة بين مفاتيح التبديل المحسّنة للذكاء الاصطناعي والمفاتيح القياسية. يجب على الفرق التقنية المخططة لنشر الذكاء الاصطناعي مراجعة طاقة الشبكة بين المواقع وكمونها واهتزازها قبل الالتزام بمعماريات التدريب الموزع.
3. إعطاء الأولوية للتبريد السائل في أي دورة شراء لخوادم الذكاء الاصطناعي
قرار التبريد السائل في Fairwater ليس اختيارياً عند كثافات رفوف GPU تتجاوز 50 كيلوواط — وأنظمة NVIDIA Blackwell تتخطى هذا العتبة. يجب على المنظمات التي تشتري خوادم ذكاء اصطناعي للنشر المحلي أو في مراكز الاستضافة المشتركة اشتراط جاهزية التبريد السائل من المنشأة قبل الانتهاء من أي طلب لأجهزة GPU. مركز البيانات غير القادر على دعم مبادلات الحرارة في الباب الخلفي أو دوائر التبريد السائل المباشر لن يستطيع استيعاب الجيل القادم من مسرّعات الذكاء الاصطناعي خلال 24 شهراً.
4. تقييم SONiC والشبكات المفتوحة لفابريك الذكاء الاصطناعي
اختيار Microsoft لمفاتيح تبديل SONiC مع Ethernet العام لفابريك Fairwater قرار متعمد للتكلفة والمرونة: أنظمة تشغيل الشبكة مفتوحة المصدر على الأجهزة العامة أرخص بكثير من البدائل المملوكة وتسمح بتبني أسرع لمعايير التبديل الجديدة مع تطور المعايير. معيار الفابريك RoCEv2 بسرعة 800 Gbps المُستخدَم في Fairwater سيصبح المعيار القياسي للمؤسسات خلال 2-3 سنوات.
الصورة الأكبر: التوزيع الجغرافي كنموذج جديد للبنية التحتية
Fairwater هو الطرف البارز لتحول هيكلي في كيفية تفكير أكبر مشغّلي البنية التحتية للذكاء الاصطناعي في العالم بشأن العلاقة بين الجغرافيا والطاقة والحوسبة. نموذج مصنع الذكاء الاصطناعي الموزع جغرافياً يحل ثلاثة قيود في آنٍ واحد. يُفصل بين حجم الحوسبة ومدى توفر الطاقة في موقع واحد. يوفر مرونة جغرافية. ويُتيح نشر الأجهزة بالتوازي عبر مواقع متعددة، مُقلِّصاً الوقت من شحن وحدات GPU إلى طاقة تدريب إنتاجية.
بالنسبة لسوق السحابة والبنية التحتية المؤسسية الأوسع، يُشير نموذج Fairwater إلى أن الاستثمار في الشبكات عالية السعة والكمون المنخفض بين مراكز البيانات لم يعد عبئاً تقنياً اختيارياً — إنه تقنية التمكين الأساسية للذكاء الاصطناعي على نطاق واسع. Fairwater هو جواب Microsoft على سؤال ما تبدو عليه البنية التحتية للذكاء الاصطناعي على نطاق واسع. والجواب هو: موزعة، مبرّدة بالسوائل، ذات شبكة مفتوحة، ومتصلة بالألياف عبر مئات الأميال.
الأسئلة الشائعة
ما الذي يُميّز التصميم الموزع لـ Fairwater عن مركز بيانات متعدد المواقع القياسي؟
مراكز البيانات متعددة المواقع التقليدية تُكرّر أعباء العمل لاسترداد الكوارث أو تخدم قواعد مستخدمين جغرافية مختلفة — لكنها لا تعمل كنظام حوسبة موحد واحد. ابتكار Fairwater أن المسافة البالغة 700 ميل بين Atlanta وWisconsin شفافة لأعباء عمل تدريب الذكاء الاصطناعي: يمكن لوحدات GPU في كلا الحرمَين المشاركة في مهمة تدريب موزعة واحدة في وقت واحد، مُتزامنةً عبر AI WAN. يستلزم ذلك اتصالاً بصرياً مخصصاً وكمون منخفض وإنتاجية عالية بنته Microsoft خصيصاً لحركة الذكاء الاصطناعي.
لماذا التبريد السائل إلزامي لنشر وحدات GPU Blackwell؟
الطاقة الحرارية لتصميم وحدات GPU NVIDIA Blackwell تتجاوز 700 واط لكل شريحة. رف GB200 NVL72 بـ72 وحدة GPU Blackwell يُولّد حمل حراري لا يستطيع التبريد الهوائي التقليدي إزالته بسرعة كافية لتجنب التقييد الحراري — وهي الحالة التي تُخفّض فيها وحدات GPU تردد ساعتها لتجنب الارتفاع في درجة الحرارة، مما يُقلص إنتاجية تدريب الذكاء الاصطناعي مباشرةً. تستطيع أنظمة التبريد السائل التعامل مع 10 إلى 50 ضعف التدفق الحراري للتبريد الهوائي لكل متر مربع من مساحة الرف.
هل يمكن للشركات تكرار أجزاء من معمارية Fairwater على نطاق أصغر؟
نعم — لا سيما مبادئ الشبكات والتبريد. الشبكات المفتوحة المستندة إلى SONiC مع Ethernet العام متاحة من موردين متعددين بالحجم المؤسسي. حلول التبريد السائل من موردين كـVertiv وSchneider Electric وCoolIT Systems متاحة لنشر خوادم ذكاء اصطناعي بالحجم المؤسسي. مبدأ AI WAN — شبكة مخصصة وكمون منخفض لحركة الذكاء الاصطناعي منفصلة عن شبكة WAN العامة للمؤسسة — قابل للتطبيق بأحجام أصغر بكثير.
المصادر والقراءات الإضافية
- From Wisconsin to Atlanta: Microsoft Connects Datacenters to Build Its First AI Superfactory — Microsoft News
- Microsoft’s Fairwater Atlanta and the Rise of the Distributed AI Supercomputer — Data Center Frontier
- Microsoft Launches Atlanta Fairwater Data Center: Two Stories, No UPS or Gen-Sets — Data Center Dynamics
- New Data Center Developments May 2026 — Data Center Knowledge












