اللحظة البرمجية في الروبوتات

لعقود من الزمن، كانت الروبوتات قصة عتاد. كانت إنجازات هذه الصناعة مادية: الروبوت البشري الذي يؤدي شقلبات خلفية من Boston Dynamics، وروبوتات المستودعات من Amazon، ونموذج Optimus الأولي من Tesla. تدفقت الاستثمارات نحو شركات تبني محركات ومستشعرات وقابضات ومنصات ميكانيكية أفضل. كانت الفرضية الضمنية أن عنق الزجاجة في الروبوتات هو الجسم — وأنه إذا استطعنا بناء روبوت يتحرك كالإنسان، فإن الذكاء سيلحق به.

انعكست هذه الفرضية. في فبراير 2026، تتدفق أكبر الاستثمارات في الروبوتات ليس نحو شركات تبني أجسام الروبوتات بل نحو شركات تبني عقول الروبوتات. جمعت Physical Intelligence مبلغ 600 مليون دولار بتقييم 5.6 مليار دولار — بدعم من Jeff Bezos — لنموذج الأساس الروبوتي الشامل الخاص بها. وحصلت RLWRLD على 41 مليون دولار لتدريب نماذج الذكاء الاصطناعي الروبوتي داخل بيئات المصانع العاملة. وأصدرت Nvidia، في معرض CES 2026، مجموعة من نماذج الذكاء الاصطناعي الفيزيائي المصممة لمنح أي منصة روبوتية الذكاء اللازم للإدراك والتخطيط والتصرف في العالم المادي.

التشابه مع ثورة نماذج اللغة (Language Models) مقصود ومُفيد. قبل أن يُثبت GPT-3 في عام 2020 أن نموذجاً واحداً كبيراً يمكنه أداء آلاف المهام اللغوية، كانت معالجة اللغة الطبيعية (NLP) تهيمن عليها أنظمة متخصصة — نموذج للترجمة، وآخر لتحليل المشاعر، وآخر للتلخيص. استبدل نهج نموذج الأساس (Foundation Model) هذا التشتت بنظام واحد متعدد الأغراض يمكن تكييفه لأي مهمة.

كانت الروبوتات في 2025 تحتل موقعاً مماثلاً لمعالجة اللغة الطبيعية في 2019. كل تطبيق روبوتي — تحضير الطلبات في المستودعات، المساعدة الجراحية، الحصاد الزراعي، التجميع الصناعي — كان يتطلب نظام تحكم مُصمماً خصيصاً ومُدرَّباً على تلك المهمة بعينها. لم يستطع روبوت مُدرَّب على التقاط الطرود فرزها. ولم يستطع روبوت مُدرَّب على تخطيط مصنع واحد التكيف مع مصنع آخر. كان عمل برمجة كل روبوت لكل مهمة هو التكلفة الرئيسية للنشر، متجاوزاً بكثير تكلفة العتاد الروبوتي ذاته.

تَعِد نماذج الأساس للروبوتات بتغيير هذه المعادلة جذرياً.

Physical Intelligence: رهان الـ 5.6 مليار دولار

تُعدّ Physical Intelligence (اختصاراً Pi) الشركة الأبرز التي تتبنى نهج نماذج الأساس الروبوتية. تأسست على يد باحثين من UC Berkeley وStanford وGoogle، وتقوم أطروحة الشركة على أن قوانين التوسع (Scaling Laws) نفسها التي حوّلت نماذج اللغة تنطبق على التحكم الروبوتي: درّب نموذجاً كبيراً بما يكفي على بيانات تفاعل روبوتي متنوعة بما يكفي، وسيطوّر ذكاءً فيزيائياً متعدد الأغراض ينتقل عبر أجسام ومهام روبوتية مختلفة.

جولة التمويل البالغة 600 مليون دولار بتقييم 5.6 مليار دولار، مع Jeff Bezos من بين المستثمرين، تجعل Pi أعلى شركة ذكاء اصطناعي روبوتي تقييماً في التاريخ. الارتباط بـ Bezos ليس مصادفة: تُشغّل Amazon أكبر أسطول في العالم من روبوتات المستودعات وستستفيد بشكل هائل من ذكاء روبوتي متعدد الأغراض يمكنه تقليل تكلفة برمجة نشر الروبوتات عبر مئات مراكز التوزيع التابعة لها.

يتضمن نهج Pi تدريب نماذج قائمة على المحوّلات (Transformers) على مجموعات بيانات ضخمة من التفاعلات الروبوتية — عروض مسجّلة بواسطة مشغّلين بشريين، وتفاعلات محاكاة في بيئات افتراضية، واستكشاف مستقل بواسطة أنظمة روبوتية في بيئات حقيقية. يُشفّر النموذج الناتج فهماً عاماً للتفاعل المادي: كيف تستجيب الأشياء للقوى، وكيف يتم تخطيط تسلسلات الإجراءات لتحقيق الأهداف، وكيف يتم التكيف عند حدوث شيء غير متوقع.

أثبتت الشركة قدرة نموذجها على التحكم في منصات روبوتية متعددة — تكوينات أذرع مختلفة، وأنواع قابضات مختلفة، ومجموعات مستشعرات مختلفة — لأداء مهام لم يُدرَّب عليها النموذج صراحةً. العروض مُثيرة للإعجاب لكنها مُنظّمة بعناية، والفجوة بين عرض مختبري وتشغيل موثوق في بيئة واقعية فوضوية تظل كبيرة.

ما يُميّز Pi عن الجهود السابقة في الذكاء الاصطناعي الروبوتي هو حجم كل من النموذج وبيانات التدريب. أنظمة التعلم الروبوتي السابقة تدرّبت على آلاف أو عشرات الآلاف من حلقات التفاعل. يتدرّب نموذج Pi على ملايين الحلقات، يجمع بين العروض الحقيقية والبيانات الاصطناعية من محاكاة دقيقة فيزيائياً. الفرضية — غير مُثبتة لكنها مؤسسة نظرياً — هي أن القدرات الناشئة نفسها التي ظهرت في نماذج اللغة على نطاق واسع (الاستدلال، التعميم، التعلم بأمثلة قليلة) ستظهر في نماذج الذكاء الاصطناعي الفيزيائي مع توفر بيانات وقدرة حوسبة كافية.

RLWRLD: التعلم داخل المصنع

تمثل RLWRLD (تُنطق “real world”) نهجاً مكمّلاً لـ Physical Intelligence. حيث تبني Pi نموذج أساس متعدد الأغراض في المختبر، تُدرّب RLWRLD نماذجها داخل بيئات المصانع العاملة، متعلمةً من الظروف الفعلية التي يجب على الروبوتات التعامل معها في الإنتاج.

جمعت الشركة 41 مليون دولار لنشر بنيتها التحتية للتدريب — مزيج من المستشعرات والعتاد الحاسوبي وأنظمة الذكاء الاصطناعي الطرفي (Edge AI) — مباشرة على أرضيات المصانع. تتعلم المنصات الروبوتية المجهزة بنظام RLWRLD من خلال التفاعل مع منتجات حقيقية وسيور ناقلة حقيقية وظروف بيئية حقيقية، بتوجيه من خوارزميات التعلم المعزز (Reinforcement Learning) التي تُحسّن إنجاز المهام مع احترام قيود السلامة.

ميزة RLWRLD هي واقعية البيانات. البيئات المحاكاة، مهما كانت دقتها فيزيائياً، لا تستطيع تكرار تقلبات التصنيع الحقيقي بشكل مثالي: الطريقة التي ينثني بها مادة معينة عند الإمساك بها، والخصائص البصرية لمنتج معين تحت إضاءة معينة، والاهتزازات والضوضاء في أرضية مصنع معينة. من خلال التدريب في بيئات الإنتاج، تواجه نماذج RLWRLD وتتكيف مع هذه الظروف الواقعية منذ البداية، مما قد يُقلّص فجوة النقل من المحاكاة إلى الواقع (Sim-to-real) التي حدّت من مناهج التعلم الروبوتي السابقة.

المقايضة هي السرعة والقابلية للتوسع. التدريب في المصانع الحقيقية أبطأ من التدريب في المحاكاة (الإجراءات المادية تستغرق وقتاً حقيقياً) ويتطلب وصولاً مادياً إلى بيئات الإنتاج (ليست كل المصانع مستعدة لاستضافة تدريب تجريبي للذكاء الاصطناعي على خط إنتاجها). يتضمن نموذج أعمال RLWRLD شراكات مع مصنّعين يوفرون الوصول إلى منشآتهم مقابل الحصول المبكر على قدرات الذكاء الاصطناعي الناتجة.

استراتيجية منصة الذكاء الاصطناعي الفيزيائي من Nvidia

يمثل إصدار Nvidia لنماذج الذكاء الاصطناعي الفيزيائي في معرض CES 2026 استراتيجية المنصة التي قد تُسرّع القطاع بأكمله. بدلاً من بناء تطبيقات روبوتية محددة، توفر Nvidia نماذج الذكاء الاصطناعي الأساسية والبنية التحتية للمحاكاة وأطر النشر التي تستخدمها شركات أخرى — سواء ناشئة أو مصنّعي روبوتات راسخين — لتطوير أنظمة روبوتية ذكية.

يتكون نهج Nvidia من ثلاث مكونات. أولاً، Isaac Sim، وهي منصة محاكاة دقيقة فيزيائياً مدعومة بتقنية Omniverse من Nvidia، توفر البيئة الافتراضية حيث يمكن تدريب الذكاء الاصطناعي الروبوتي على نطاق واسع. تُتيح Isaac Sim لآلاف الروبوتات المحاكاة التدرب في وقت واحد، مُضغّطةً أشهراً من التدريب الحقيقي في ساعات من التجربة المحاكاة.

ثانياً، أصدرت Nvidia نماذج ذكاء اصطناعي فيزيائي مُدرَّبة مسبقاً — تشمل نماذج لمعالجة الأشياء والملاحة والتفاعل بين الإنسان والروبوت — يمكن للمطورين استخدامها كنقاط انطلاق لتطبيقات محددة. هذه النماذج بالنسبة للروبوتات هي ما يمثله GPT بالنسبة للتطبيقات اللغوية: أساس متعدد الأغراض يمكن ضبطه الدقيق (Fine-tuning) لمهام محددة بكميات صغيرة نسبياً من البيانات الخاصة بالمهمة.

ثالثاً، توفر منصة الحوسبة Jetson من Nvidia العتاد الطرفي (Edge Hardware) الذي يُشغّل نماذج الذكاء الاصطناعي على المنصات الروبوتية في الوقت الفعلي. تُقدّم أحدث وحدات Jetson أداء الحوسبة المطلوب للإدراك والتخطيط والتحكم في الوقت الفعلي بمستويات طاقة تتناسب مع ميزانية الطاقة للروبوت.

تعكس استراتيجية Nvidia للذكاء الاصطناعي الفيزيائي نهجها الناجح في مراكز البيانات: توفير حزمة العتاد والبرمجيات الكاملة التي تُسهّل البناء على منصة Nvidia، واقتناص القيمة في كل طبقة. إذا نجح نهج نماذج الأساس الروبوتية، فإن Nvidia في وضع يؤهلها لتكون مزود المنصة المهيمن بغض النظر عن الشركات المحددة التي تفوز في مجالات تطبيقية محددة.

إعلان

التشابه مع ثورة النماذج اللغوية الكبيرة

تستند أطروحة نماذج الأساس الروبوتية صراحةً إلى دروس ثورة النماذج اللغوية الكبيرة (LLM). اتبعت تلك الثورة نمطاً محدداً: نماذج كبيرة متعددة الأغراض مُدرَّبة على بيانات متنوعة على نطاق واسع طوّرت قدرات ناشئة لم تستطع النماذج المتخصصة مضاهاتها. التحوّل الناتج — من عشرات أنظمة معالجة اللغة الطبيعية المتخصصة إلى نموذج أساس واحد مُكيَّف لمهام متعددة — ضغط سنوات من تطوير التطبيقات في أشهر وجعل الذكاء الاصطناعي متاحاً لمنظمات بدون خبرة عميقة في التعلم الآلي.

يُجادل المدافعون عن نهج نماذج الأساس الروبوتية بأن النمط نفسه سيتكرر في الروبوتات. المكونات الرئيسية هي نفسها: معماريات المحوّلات (Transformers) القادرة على معالجة وسائط إدخال متنوعة، وقوانين التوسع التي تتنبأ بكيفية تحسن قدرة النموذج مع الحجم والبيانات، والبنية التحتية للتدريب القادرة على توليد بيانات تفاعل متنوعة على نطاق واسع.

للتشابه حدود مهمة. اللغة رقمية بطبيعتها — يمكن ترميزها ومعالجتها وتوليدها في رموز منفصلة. التفاعل المادي مستمر وعالي الأبعاد ولا يرحم. نموذج لغة يُولّد كلمة خاطئة قليلاً يُنتج جملة غير متماسكة بعض الشيء. نموذج روبوتي يُولّد متجه قوة خاطئاً قليلاً يكسر الشيء الذي يحاول التعامل معه — أو الأسوأ، يُصيب شخصاً قريباً.

متطلبات السلامة للذكاء الاصطناعي الفيزيائي مختلفة نوعياً عن تلك الخاصة بالذكاء الاصطناعي الرقمي. روبوت محادثة (Chatbot) يُهلوس يُسبب إحراجاً. روبوت يُهلوس يُسبب أضراراً مادية أو إصابات جسدية. هذا التباين يعني أن نماذج الأساس الروبوتية يجب أن تحقق موثوقية أعلى بشكل كبير من نماذج اللغة قبل نشرها على نطاق واسع، مما قد يُبطئ منحنى التبني مقارنة بالنشر السريع للنماذج اللغوية الكبيرة.

التداعيات على المستودعات والخدمات اللوجستية والتصنيع

التطبيقات التجارية الفورية لنماذج الأساس الروبوتية تقع في البيئات المنظمة ذات الأحجام العالية من المهام المادية المتكررة: المستودعات والمراكز اللوجستية ومنشآت التصنيع. تتشارك هذه البيئات خصائص تجعلها ملائمة لقدرات الذكاء الاصطناعي الروبوتي الحالية — تخطيطات يمكن التنبؤ بها، وأشياء موحدة، ومجموعات مهام مقيّدة نسبياً — مع تقديم عوائد اقتصادية واضحة تُبرّر الاستثمار.

في عمليات المستودعات، يتضمن أحدث ما توصلت إليه التقنية روبوتات قادرة على التنقل بشكل مستقل (الروبوتات المتنقلة المستقلة، أو AMR) وروبوتات قادرة على التقاط عناصر محددة من الرفوف (أنظمة الالتقاط والوضع أو Pick-and-place). هذه الأنظمة فعالة لكنها محدودة: لا يستطيع AMR التقاط العناصر، ولا يستطيع روبوت الالتقاط التنقل. نماذج الأساس التي تُمكّن منصة روبوتية واحدة من أداء مهام متعددة — التنقل إلى رف، وتحديد العنصر الصحيح، والتقاطه، ونقله إلى محطة التعبئة، ووضعه للشحن — ستزيد بشكل كبير من العائد على الاستثمار في روبوتات المستودعات.

تُعدّ Amazon، التي تنشر أكثر من 750,000 روبوت عبر شبكة التوزيع الخاصة بها، المستفيد الأكثر وضوحاً. تستخدم الشركة حالياً أنظمة روبوتية منفصلة للنقل والفرز والالتقاط، يتطلب كل منها برمجة وإدارة مستقلة. نموذج أساس يُمكّن من سلوك روبوتي متعدد الأغراض سيسمح لـ Amazon باستبدال أنظمة متخصصة متعددة بمنصات أقل عدداً وأكثر تنوعاً — مما يُقلّل التكاليف الرأسمالية ويُبسّط العمليات ويُتيح النشر الأسرع في المنشآت الجديدة.

في التصنيع، تكمن الفرصة في الإنتاج بكميات صغيرة ومتنوعة — النموذج التصنيعي حيث تتغير المنتجات بشكل متكرر وتكون دورات الإنتاج قصيرة. تتفوق الروبوتات الصناعية التقليدية في المهام المتكررة لكنها تتطلب إعادة برمجة مكثفة لكل منتج أو عملية جديدة. نماذج الأساس التي تُمكّن الروبوتات من تعلم مهام جديدة من عدد قليل من العروض — بشكل مماثل لقدرة التعلم بأمثلة قليلة (Few-shot Learning) في نماذج اللغة — ستجعل الروبوتات مجدية اقتصادياً للمصنّعين الذين لا يستطيعون حالياً تبرير تكلفة البرمجة لدورات إنتاج قصيرة.

مسألة العتاد

لا تعني أطروحة البرمجيات أولاً أن العتاد الروبوتي غير مهم. بل تعني أن عنق الزجاجة قد انتقل. قبل عشر سنوات، كان القيد على الروبوتات المفيدة هو المنصة المادية: المستشعرات كانت مكلفة للغاية، والمحركات غير دقيقة للغاية، والعتاد الحاسوبي ضخم للغاية. خُفّفت هذه القيود بشكل كبير. كاميرات العمق عالية الجودة تكلف أقل من 200 دولار. المحركات المؤازرة الدقيقة متاحة كمكونات سلعية. معالجات الذكاء الاصطناعي الطرفي تُقدّم القدرة الحاسوبية المطلوبة للتحكم في الوقت الفعلي في حزم مدمجة وموفرة للطاقة.

النتيجة هي أن العتاد الروبوتي القادر يصبح سلعة. تعرض شركات متعددة منصات أذرع روبوتية متعددة الأغراض بأسعار تقل عن 30,000 دولار — جزء بسيط من تكلفة الروبوتات الصناعية التقليدية. المنصات البشرية الشكل (Humanoid)، رغم أنها لا تزال مكلفة ومحدودة، يتم تطويرها من قبل Tesla وFigure AI و1X Technologies وغيرها بهدف صريح لتصبح منصات مادية متعددة الأغراض.

في هذه البيئة، العامل المُميّز هو الذكاء وليس الميكانيكا. ذراع روبوتية بقيمة 25,000 دولار مزودة بذكاء اصطناعي متطور قادر على تعلم مهام جديدة في ساعات أكثر قيمة من روبوت صناعي بقيمة 100,000 دولار يتطلب أسابيع من البرمجة لكل تطبيق جديد. تُفضّل الاقتصاديات بشكل متزايد الاستثمار في برمجيات الذكاء الاصطناعي — التي تتوسع بتكلفة هامشية صفرية عبر المنصات الروبوتية — مقابل الاستثمار في عتاد مخصص يتوسع خطياً مع النشر.

لهذا التحول تداعيات عميقة على هيكل صناعة الروبوتات. شركات العتاد التي لا تطوّر أو تدمج قدرات الذكاء الاصطناعي تُخاطر بالتسليع. شركات الذكاء الاصطناعي المحايدة تجاه العتاد — مثل Physical Intelligence، التي تصمم نماذجها للعمل عبر منصات روبوتية متعددة — تلتقط قيمة غير متناسبة. التشابه مع صناعة الهواتف الذكية، حيث التقطت منصات البرمجيات (iOS وAndroid) قيمة أكبر من مصنّعي العتاد (باستثناء Apple)، وثيق الصلة.

ما الذي يأتي بعد ذلك

نماذج الأساس الروبوتية في أولى مراحل مسار تطورها. العروض واعدة لكن النشر الإنتاجي محدود. الفجوة بين روبوت قادر على التقاط أشياء متنوعة في بيئة مختبرية مُحكمة وروبوت يعمل بموثوقية 20 ساعة يومياً في مستودع فوضوي كبيرة.

المسار الأكثر ترجيحاً على المدى القريب يتضمن نشر نماذج الأساس لتطبيقات محددة عالية القيمة في بيئات منظمة — الالتقاط في المستودعات، وفحص الجودة، والتجميع المتكرر — بدلاً من الروبوتات متعددة الأغراض. توفر هذه التطبيقات الإيرادات والبيانات الحقيقية التي تُموّل التحسين المستمر للنماذج، مُنشئةً دولاب البيانات الذي سرّع تطوير نماذج اللغة.

المسار على المدى المتوسط — 3 إلى 5 سنوات — قد يشهد نماذج الأساس تُمكّن الروبوتات من تعلم مهام جديدة من عرض توضيحي بسيط، مما يُقلّل بشكل كبير من تكلفة ووقت نشر الروبوتات في التصنيع والخدمات اللوجستية وربما بيئات الخدمة. سيمثل هذا اللحظة المكافئة في الروبوتات لـ GPT-3 في اللغة: إثبات أن القدرة متعددة الأغراض، وليس البرمجة المتخصصة، هي الطريق نحو النشر الواسع.

المسار على المدى الطويل — 5 إلى 10 سنوات — يتضمن روبوتات بذكاء فيزيائي متطور بما يكفي للعمل في بيئات غير منظمة جنباً إلى جنب مع البشر. تمثل الرعاية الصحية والبناء والزراعة والتطبيقات المنزلية أسواقاً ضخمة تتطلب هذا المستوى من القدرة. سواء أكانت نماذج الأساس قادرة على تحقيق هذا المستوى من الذكاء الفيزيائي، أم أن مناهج مختلفة جذرياً ستكون مطلوبة، يبقى سؤالاً مفتوحاً.

ما ليس محل تساؤل هو اتجاه الاستثمار واهتمام البحث. انتقل مركز ثقل صناعة الروبوتات من هندسة العتاد إلى برمجيات الذكاء الاصطناعي. تقييم Physical Intelligence البالغ 5.6 مليار دولار، ومنصة الذكاء الاصطناعي الفيزيائي من Nvidia، والكوكبة المتنامية من الشركات الناشئة التي تُدرّب نماذج الأساس الروبوتية، كلها تُشير إلى الاستنتاج نفسه: الاختراق الحقيقي في الروبوتات برمجي، وهو يحدث الآن.

إعلان

🧭 رادار القرار (المنظور الجزائري)

البُعد التقييم
الصلة بالجزائر متوسطة — قطاعا التصنيع واللوجستيات في الجزائر يمكن أن يستفيدا من الروبوتات متعددة الأغراض، لكن التبني يعتمد على تخفيضات التكلفة التي تعد نماذج الأساس بتحقيقها خلال 3-5 سنوات القادمة
جاهزية البنية التحتية؟ لا — مصانع الجزائر تعتمد بشكل كبير على العمالة اليدوية أو الروبوتات الصناعية القديمة؛ البنية التحتية الرقمية (شبكات عالية السرعة، حوسبة حافة، بيئات محاكاة) المطلوبة للروبوتات المدفوعة بنماذج الأساس غائبة
توفر المهارات؟ لا — الذكاء الاصطناعي للروبوتات وتدريب نماذج الأساس والنقل من المحاكاة إلى الواقع وتكامل أنظمة الروبوتات مجالات متخصصة للغاية بلا خبرة محلية تقريباً؛ برامج الروبوتات الجامعية تركز على أنظمة التحكم التقليدية
الجدول الزمني للعمل 12-24 شهراً — ينبغي للمصنّعين الجزائريين بدء برامج تجريبية مع منصات روبوتية متوفرة تجارياً لبناء الجاهزية التنظيمية لعصر نماذج الأساس
أصحاب المصلحة الرئيسيون شركات التصنيع (Cevital، SNVI)، Sonatrach (فحص خطوط الأنابيب، الروبوتات في البيئات الخطرة)، مختبرات الروبوتات الجامعية، وزارة الصناعة، معاهد التدريب الصناعي
نوع القرار استراتيجي — التحول من البرمجة المخصصة إلى نماذج الأساس سيُخفّض بشكل كبير تكلفة نشر الروبوتات، مما يجعل الروبوتات قابلة للتطبيق في قطاع التصنيع الجزائري لأول مرة

الخلاصة: ثورة نماذج الأساس الروبوتية تهم الجزائر لأنها تعد بحل مشكلة التكلفة التي أبقت الروبوتات خارج المصانع الجزائرية. عندما يتمكن ذراع روبوتي بقيمة 25,000 دولار مع ذكاء اصطناعي متعدد الأغراض من تعلم مهام جديدة في ساعات بدلاً من أسابيع من البرمجة المخصصة، تتغير المعادلة الاقتصادية لصالح المصنّعين الجزائريين. ينبغي لشركات صناعية مثل Cevital بدء تجارب روبوتية صغيرة النطاق الآن لتطوير الخبرة الداخلية قبل أن تصبح الأنظمة المدعومة بنماذج الأساس متاحة تجارياً.

المصادر والقراءات الإضافية