قارة تبني ذكاءها الاصطناعي الخاص
في سباق الذكاء الاصطناعي العالمي، هيمن على السردية حفنة من اللاعبين: OpenAI وAnthropic في الولايات المتحدة، وGoogle DeepMind بين لندن وماونتن فيو، وMistral في باريس، ومجموعة من المختبرات الطموحة في الصين. أما بقية العالم — الغالبية العظمى من البشرية — فقد صُوِّر كمستهلك للذكاء الاصطناعي المبني في مكان آخر، والمدرب على بيانات تعكس لغة شخص آخر وثقافته وأولوياته.
تحدت تشيلي هذه السردية. في 10 فبراير 2026، كشف المركز الوطني للذكاء الاصطناعي (CENIA) عن Latam-GPT بحضور الرئيس التشيلي Gabriel Boric. مبني على بنية Llama 3.1 من Meta ومدرب على أكثر من 300 مليار رمز من بيانات أمريكا اللاتينية بالإسبانية والبرتغالية، يُعد Latam-GPT أول نموذج أساسي مفتوح أُنشئ بالكامل داخل أمريكا اللاتينية — من جمع البيانات والتدريب المسبق إلى التدريب اللاحق. بدعم من اتحاد يضم أكثر من 60 مؤسسة وقرابة 200 متخصص عبر ثماني دول لاتينوأمريكية أساسية، قُدم المشروع بشكل مشترك من CENIA وCAF (بنك التنمية لأمريكا اللاتينية والكاريبي) وحكومة تشيلي وAWS ومرصد البيانات.
قد لا يكون الرقم الأكثر لفتًا في قصة Latam-GPT حجم النموذج بل ميزانيته: 550,000 دولار — ممولة أساسًا من CENIA وCAF. في مجال تكلف فيه جولات تدريب النماذج الرائدة مئات الملايين من الدولارات بشكل روتيني، يوضح المشروع ما يمكن أن يحققه الجهد المركّز والتعاوني حتى بموارد متواضعة.
المشروع ليس إنجازًا تقنيًا فحسب. إنه بيان سياسي حول من يحق له تشكيل أنظمة الذكاء الاصطناعي التي تتوسط بشكل متزايد الوصول إلى المعلومات والخدمات والفرص. في عالم تُدرب فيه نماذج الذكاء الاصطناعي المهيمنة أساسًا على بيانات باللغة الإنجليزية — تمثل الإسبانية نحو 4% من بيانات تدريب النماذج اللغوية الكبيرة النموذجية، والبرتغالية 2% فقط — فإن Latam-GPT تأكيد على أن سكان أمريكا اللاتينية البالغ عددهم نحو 660 مليون نسمة يستحقون ذكاءً اصطناعيًا يفهم لغاتهم وسياقاتهم واحتياجاتهم.
البنية التقنية
لم يُدرب Latam-GPT من الصفر — وهو مسعى كان سيتطلب مليارات الدولارات في الحوسبة، بعيدًا عن ميزانية أي مؤسسة لاتينوأمريكية. بدلًا من ذلك، اتخذ المشروع نهجًا براغماتيًا: انطلق من Llama 3.1 من Meta كأساس وأجرى حملة تدريب مسبق مستمرة موسعة مركزة على بيانات أمريكا اللاتينية.
مجموعة بيانات التدريب، المنسقة على مدى أكثر من عامين بواسطة فرق عبر الاتحاد، تشمل وثائق حكومية من دول أمريكا اللاتينية، وأوراق أكاديمية من جامعات إقليمية، وقرارات محاكم، وسجلات مكتبات، وكتب مدرسية، ومقالات إخبارية من وسائل إعلام لاتينوأمريكية رئيسية، وأعمال أدبية في الملك العام، ونصوص قانونية، ومحتوى ويب منسق بالإسبانية والبرتغالية. يتجاوز إجمالي مجموعة البيانات ثمانية تيرابايت — تضم أكثر من 300 مليار رمز نص عادي، أي ما يعادل نحو 230 مليار كلمة. متواضع بمعايير تدريب النماذج الرائدة لكنه كبير لجهد إقليمي، والأهم أنه مركز بشكل كبير على السياقات اللغوية والثقافية المحددة التي تتعامل معها النماذج العالمية بشكل سيئ.
كيّفت عملية التدريب المسبق المستمر معرفة Llama الحالية مع خصوصيات الإسبانية والبرتغالية اللاتينوأمريكية. تختلف الإسبانية اللاتينوأمريكية اختلافًا كبيرًا عن الإسبانية الأوروبية في المفردات والتعبيرات الاصطلاحية والسجل اللغوي. وتتباين البرتغالية البرازيلية والبرتغالية الأوروبية بشكل أكثر حدة. النموذج المدرب أساسًا على نصوص إسبانية أوروبية أو عامة سيسيء فهم التعبيرات الإقليمية، ويخطئ في التعامل مع المصطلحات الخاصة بكل بلد، وينتج مخرجات تبدو غريبة على المستخدمين اللاتينوأمريكيين. صُمم Latam-GPT خصيصًا لسد هذه الفجوة. تتضمن بيانات التدريب أيضًا لغات أصلية — Nahuatl وQuechua وMapudungun — بالإضافة إلى متغيرات لهجات الكاريبي، رغم أن الدعم الكامل لهذه اللغات مخطط له في إصدارات مستقبلية.
بعد التدريب، خضع النموذج لضبط التعليمات والمحاذاة باستخدام ملاحظات من ناطقين أصليين عبر عدة دول. ضمنت هذه العملية أن النموذج لا يفهم النص اللاتينوأمريكي فحسب، بل يمكنه توليد استجابات تبدو طبيعية ومناسبة ثقافيًا للمستخدمين في المكسيك وكولومبيا والبرازيل والأرجنتين وتشيلي وبيرو وغيرها من الدول الممثلة في الاتحاد.
دُرب الإصدار الأول على بنية AWS السحابية التحتية، مع حاسوب فائق مخطط بقيمة 4.5 مليون دولار سيُركّب في جامعة Tarapaca في شمال تشيلي خلال النصف الأول من 2026 لدعم جولات التدريب المستقبلية. أُطلق النموذج كنموذج مفتوح، مع أدوات أولية متاحة على Hugging Face. والأهم أن Latam-GPT لا يُقدم كروبوت دردشة استهلاكي بل كبنية تحتية أساسية — مصمم لسير العمل كثيف النصوص الشائع عبر الإدارة العامة والخدمات، بما في ذلك صياغة المستندات والتلخيص والترجمة واسترجاع المعرفة ودعم المواطنين.
لماذا يهم الذكاء الاصطناعي السيادي
اكتسب مفهوم “الذكاء الاصطناعي السيادي” — تطوير أنظمة ذكاء اصطناعي تعكس وتخدم مصالح أمة أو منطقة محددة — زخمًا هائلًا في جميع أنحاء العالم. تدافع فرنسا عن Mistral كإجابة أوروبية على هيمنة الذكاء الاصطناعي الأمريكي. تستثمر دول الخليج بكثافة، حيث أطلق معهد الابتكار التكنولوجي في أبوظبي Falcon 3 وFalcon-H1 Arabic — الذي أصبح الآن نموذج الذكاء الاصطناعي العربي الرائد — باستخدام بنية هجينة مبتكرة Mamba-Transformer. أطلقت الهند منصة Bhashini، منصة حكومية تدعم الذكاء الاصطناعي في 22 لغة هندية نُقلت مؤخرًا إلى بنية سحابية محلية. وأعلنت كل من اليابان وكوريا الجنوبية وسنغافورة استراتيجيات وطنية للذكاء الاصطناعي بتمويل عام كبير.
الدافع ليس مجرد قومية تكنولوجية. إنه يعكس قلقًا حقيقيًا ومبررًا حول ما يحدث عندما تُبنى أنظمة الذكاء الاصطناعي التي يعتمد عليها مجتمع ما في مكان آخر، بواسطة أشخاص لديهم قيم وأولويات وسياقات ثقافية مختلفة.
اللغة هي البُعد الأكثر وضوحًا. رغم التقدم في القدرات متعددة اللغات، تظل نماذج الذكاء الاصطناعي الرائدة أفضل بشكل كبير بالإنجليزية من أي لغة أخرى. تفهم التعبيرات الاصطلاحية الإنجليزية والفكاهة والمرجعيات الثقافية والمصطلحات التقنية بعمق لا تستطيع مضاهاته بالإسبانية أو البرتغالية أو العربية أو الهندية. بالنسبة لمليارات الأشخاص الذين لا يتحدثون الإنجليزية كلغة أساسية، يعني هذا أن ثورة الذكاء الاصطناعي تقدم منتجًا متدني الجودة — والتدهور أكبر تحديدًا في المجالات التي تهم فيها الخصوصية الثقافية واللغوية أكثر.
لكن القلق يتجاوز اللغة. تُشفّر نماذج الذكاء الاصطناعي قيمًا وافتراضات في بيانات تدريبها وعمليات محاذاتها. النموذج المدرب أساسًا على بيانات أمريكية وأوروبية سيعكس وجهات نظر أمريكية وأوروبية في مواضيع تتراوح من الحوكمة إلى الاقتصاد إلى الأعراف الاجتماعية. قد يسيء فهم أو تمثيل السياقات المحلية، أو يوصي بحلول غير مناسبة للمشكلات المحلية، أو ببساطة يفتقر إلى المعرفة حول قضايا حيوية للمجتمعات غير الغربية.
يعالج Latam-GPT هذه المخاوف مباشرة. بالتدريب على بيانات لاتينوأمريكية، مع ملاحظات من مستخدمين لاتينوأمريكيين، تحت إشراف باحثين لاتينوأمريكيين، صُمم النموذج لخدمة المنطقة وفق شروطها الخاصة. إنه ليس طبقة ترجمة فوق نموذج أمريكي — بل نموذج كُيّف من الأساس ليفكر بالإسبانية والبرتغالية اللاتينوأمريكية.
إعلان
نموذج الاتحاد
واحد من أهم ابتكارات Latam-GPT تنظيمي أكثر منه تقني. بناء نموذج ذكاء اصطناعي تنافسي يتطلب موارد هائلة — بيانات وحوسبة وكفاءات وتمويل — لا تستطيع أي مؤسسة لاتينوأمريكية واحدة توفيرها بمفردها. كان الحل اتحادًا قاريًا يجمع الموارد عبر الحدود الوطنية.
يضم الاتحاد جامعات ووكالات حكومية ومعاهد بحثية من تشيلي والبرازيل والمكسيك وكولومبيا والأرجنتين وبيرو والإكوادور وأوروغواي كدول أساسية مساهمة بالبيانات، مع شبكة أوسع تمتد إلى 15 دولة لاتينوأمريكية وكاريبية. ساهم كل شريك ببيانات وخبرات وفي بعض الحالات موارد حوسبة. أدار التنسيق CENIA في سانتياغو، الذي عمل كمركز تقني ومنشأة تدريب رئيسية، مع توفير AWS البنية التحتية السحابية للتدريب الأولي.
لهذا النموذج مزايا وتحديات. المزايا واضحة: تجميع الموارد يجعل ممكنًا ما لا تستطيع أي مؤسسة واحدة تحقيقه. يضمن تنوع المؤسسات المساهمة أن بيانات التدريب ومعايير التقييم تعكس كامل تنوع الثقافات اللاتينوأمريكية بدلًا من منظور دولة واحدة. ساهمت البرازيل بخبرة اللغة البرتغالية وبيانات منطقة الأمازون. قدمت المكسيك متخصصين في اللغات الأصلية ومحتوى تعليمي. ساهمت كولومبيا بأنظمة معرفة التنوع البيولوجي والزراعة. يعني نموذج الإصدار المفتوح أن الفوائد تتدفق إلى المنطقة بأكملها بدلًا من التراكم لكيان تجاري واحد.
التحديات حقيقية بالقدر ذاته. التنسيق عبر أكثر من 60 مؤسسة في عدة دول يتطلب التعامل مع أطر تنظيمية وثقافات مؤسسية وديناميكيات سياسية مختلفة. مشاركة البيانات عبر الحدود الوطنية تثير مخاوف تتعلق بالخصوصية والسيادة. ونموذج التمويل — 550,000 دولار من CENIA وCAF، مدعومًا بأرصدة AWS السحابية ومساهمات مؤسسية — يخلق عدم يقين حول استدامة المشروع على المدى الطويل. تطوير الذكاء الاصطناعي الرائد ليس استثمارًا لمرة واحدة بل التزام مستمر يتطلب حوسبة مستمرة وتنسيق بيانات وتحديثات للنموذج. يمثل الحاسوب الفائق المخطط بقيمة 4.5 مليون دولار في جامعة Tarapaca خطوة مهمة نحو استقلالية البنية التحتية، لكن الفجوة بين استثمار بقيمة 5 ملايين دولار والمليارات التي تنفقها مختبرات الذكاء الاصطناعي الأمريكية والصينية تظل هائلة.
دروس لأفريقيا والعالم العربي
يحمل مشروع Latam-GPT تداعيات عميقة لمناطق أخرى تجد نفسها في الطرف الاستهلاكي من فجوة الذكاء الاصطناعي. تواجه أفريقيا والعالم العربي وجنوب شرق آسيا جميعها تحديات مماثلة: سكان متنوعون لغويًا تخدمهم بشكل سيئ نماذج ذكاء اصطناعي متمحورة حول الإنجليزية، وبنية تحتية حسابية محلية محدودة، واعتماد متزايد على أنظمة ذكاء اصطناعي مبنية في Silicon Valley أو بكين.
يقدم نموذج الاتحاد قالبًا. لا تملك أي دولة أفريقية واحدة الموارد لبناء نموذج ذكاء اصطناعي رائد، لكن جهدًا قاريًا أو شبه إقليمي — يجمع بيانات من عدة دول ويستفيد من كفاءات المهجر وينسق عبر مؤسسات قائمة مثل الاتحاد الأفريقي أو جامعة الدول العربية — يمكن أن يحقق ما أظهره Latam-GPT.
بالنسبة للعالم العربي تحديدًا، أوجه التشابه لافتة. العربية الفصحى الحديثة ممثلة بشكل معقول في بيانات تدريب النماذج الرائدة، لكن العربية العامية — اللغة التي يتحدثها الناس فعليًا — ممثلة تمثيلًا ناقصًا بشكل كبير. حقق معهد الابتكار التكنولوجي في الإمارات تقدمًا كبيرًا مع Falcon-H1 Arabic، لكن جهدًا إقليميًا أوسع يغطي العربية المصرية والخليجية والمغاربية والشامية بنفس طلاقة الإنجليزية سيكون تحويليًا لمئات الملايين من الناس. سيتطلب مثل هذا النموذج جهدًا تعاونيًا عبر العالم العربي، يجمع بيانات من لهجات متنوعة ويبني أطر تقييم تعكس الطيف الكامل لاستخدام اللغة العربية.
بالنسبة لأفريقيا، التحدي أكثر حدة. مع أكثر من 2,000 لغة، يتجاوز التنوع اللغوي للقارة أي منطقة أخرى. أسس مجتمع Masakhane البحثي — الذي أصبح الآن شبكة تضم أكثر من 2,000 باحث أفريقي — مركز Masakhane للغات الأفريقية في يوليو 2025، وأطلق في يناير 2026 مبادرة كبرى لبناء مجموعات بيانات ذكاء اصطناعي لـ 50 لغة أفريقية، بهدف تمكين مليار أفريقي بحلول 2029 عبر أدوات ذكاء اصطناعي مصممة محليًا. المبادرة، المدعومة من Google.org وFCDO وIDRC ومؤسسة Gates، تبني مجموعات بيانات للتعرف التلقائي على الكلام ومعايير أداء الذكاء الاصطناعي الواقعية وبيانات متعددة الوسائط ذات صلة ثقافية عبر 40 لغة. لكن الفجوة بين هذه الجهود التأسيسية ونشر بحجم Latam-GPT لا تزال كبيرة.
حركة “الذكاء الاصطناعي لبقية العالم”
Latam-GPT جزء من حركة عالمية متنامية تتحدى الافتراض القائل بأن الذكاء الاصطناعي يجب أن يُبنى في حفنة من الدول الغنية ويُستهلك في كل مكان آخر. تشمل هذه الحركة نماذج Tiny Aya من Cohere — المُطلقة في فبراير 2026 بدعم لأكثر من 70 لغة ومتغيرات إقليمية للغات الأفريقية وجنوب آسيوية وآسيوية الباسيفيك — ومنصة Bhashini الهندية التي تعمل الآن بالكامل على بنية سحابية وحوسبة GPU هندية، وعائلة نماذج Falcon الإماراتية، من بين مشاريع أخرى كثيرة.
ما تتشاركه هذه المشاريع هو إدراك أن الذكاء الاصطناعي ليس بنية تحتية محايدة ثقافيًا كالكهرباء أو السباكة. تُشفّر أنظمة الذكاء الاصطناعي اللغة والقيم والمعرفة. عندما تُبنى هذه الأنظمة حصريًا من قبل وللمجتمعات الغربية الناطقة بالإنجليزية، فإنها تهمّش حتمًا غالبية سكان العالم. حركة الذكاء الاصطناعي السيادي هي، في جوهرها، تأكيد على أن لكل مجتمع الحق في ذكاء اصطناعي يعكس لغته وثقافته وأولوياته.
الحجة الاقتصادية تعزز الحجة الثقافية. مع تضمين الذكاء الاصطناعي في التعليم والرعاية الصحية والخدمات الحكومية والتجارة، تواجه المجتمعات التي تعتمد كليًا على أنظمة ذكاء اصطناعي أجنبية شكلًا جديدًا من التبعية الرقمية. تصبح مستهلكة لتكنولوجيا لا تتحكم بها، خاضعة لتسعير وسياسات وأولويات شركات أجنبية. بناء القدرة المحلية في الذكاء الاصطناعي ليس مجرد مسألة فخر ثقافي — بل مسألة سيادة اقتصادية.
أثبت Latam-GPT أن الذكاء الاصطناعي السيادي الإقليمي ممكن تقنيًا وقابل للتحقيق تنظيميًا — وبجزء بسيط من التكلفة التي افترض كثيرون أنها مطلوبة. السؤال التالي هو ما إذا كانت مناطق أخرى ستحذو حذو تشيلي — وما إذا كانت منظومة الذكاء الاصطناعي العالمية ستتطور إلى مشهد متعدد الأقطاب حيث تبني مجتمعات متنوعة ذكاءً اصطناعيًا يخدم احتياجاتها الخاصة، أم ستظل نظامًا أحادي القطب تهيمن عليه حفنة من الشركات في حفنة من الدول.
إعلان
🧭 رادار القرار (المنظور الجزائري)
| البُعد | التقييم |
|---|---|
| الصلة بالجزائر | عالية — تتشارك الجزائر نفس التحدي الجوهري: العربية (خاصة اللهجة المغاربية) ممثلة تمثيلًا ناقصًا بشدة في نماذج الذكاء الاصطناعي العالمية، وتعتمد البلاد كليًا على أنظمة ذكاء اصطناعي أجنبية |
| جاهزية البنية التحتية؟ | جزئية — تملك الجزائر قدرة متنامية في الحوسبة السحابية ومراكز البيانات لكنها تفتقر إلى حوسبة GPU ومجموعات بيانات عربية/أمازيغية منسقة اللازمة لتدريب نموذج سيادي |
| توفر المهارات؟ | جزئي — تنتج الجامعات الجزائرية كفاءات في الذكاء الاصطناعي/التعلم الآلي (USTHB، ESI، تلمسان)، لكن الخبرة المحددة في التدريب المسبق للنماذج اللغوية الكبيرة ومحاذاة RLHF وتنسيق البيانات متعددة اللغات نادرة |
| الجدول الزمني للعمل | 6-12 شهرًا — بدء مناقشات الاتحاد مع شركاء مغاربيين/عرب؛ 12-24 شهرًا لنموذج إقليمي تجريبي |
| أصحاب المصلحة الرئيسيون | وزارة الرقمنة، وزارة التعليم العالي، CERIST، الجامعات الجزائرية، مبادرات جامعة الدول العربية التكنولوجية، Masakhane (للأمازيغية/التمازيغت)، بنوك التنمية العربية المعادلة لـ CAF |
| نوع القرار | استراتيجي — نموذج اتحاد Latam-GPT قابل للتكرار مباشرة لجهد ذكاء اصطناعي سيادي مغاربي أو عربي |
خلاصة سريعة: نموذج اتحاد Latam-GPT بتكلفة 550,000 دولار هو أكثر مخطط ذي صلة رأته الجزائر للذكاء الاصطناعي السيادي. بدلًا من انتظار جهد وطني بمليار دولار، ينبغي للجزائر قيادة أو الانضمام إلى اتحاد مغاربي/عربي يجمع بيانات الدارجة والعربية الفصحى والأمازيغية من عدة دول — تمامًا ما فعله CENIA للإسبانية والبرتغالية اللاتينوأمريكية. تقدم مبادرة مركز Masakhane للغات الأفريقية مسار تعاون موازٍ للتمازيغت.
المصادر والقراءات الإضافية
- What Is Latam-GPT: Latin America’s Spanish and Portuguese AI Model — Euronews
- Latam-GPT and the Search for AI Sovereignty — Brookings Institution
- Launch of the First Open Large Language Model for Latin America & the Caribbean — Access Partnership
- Chile Launches Open Source Latam-GPT — Open Source For You
- Meet Latam-GPT, the New Open Source AI Model for Latin America — AI Business
- Chile Launches Latam-GPT in Push for Regional AI Sovereignty — bne IntelliNews
- Masakhane Hub Launches Funding Initiative for 50 African Languages — HapaKenya
- Falcon-H1 Arabic: World’s Leading Arabic AI Model — TII





إعلان