الفجوة في الذكاء الاصطناعي العربي التي يمكن للجزائر سدها
يتحدث العربية أكثر من 400 مليون شخص، لكنها تبقى من أكثر اللغات المهملة في مجال الذكاء الاصطناعي. تُظهر نماذج اللغة الكبيرة الحالية فجوات أداء كبيرة في المهام العربية، مع تمثيل ضعيف بشكل خاص للهجات شمال أفريقيا. الفجوة بين العربية الفصحى الحديثة (MSA) — السجل الكتابي الرسمي — والهجات المحكية المتنوعة تخلق تحدياً تقنياً لا تستطيع النماذج متعددة اللغات العامة حله.
تقف الجزائر عند مفترق طرق فريد. مع سكان يتنقلون بين الدارجة (العربية الجزائرية) والفرنسية والأمازيغية والفصحى — غالباً في محادثة واحدة — فإن التعقيد اللغوي للبلاد هو تحدٍ وفرصة في آن واحد. النماذج التي تستطيع فهم العربية الجزائرية يجب أن تتعامل مع التنوع اللهجي والمفردات الفرنسية المدمجة في البنية العربية والعبارات الأمازيغية — واقع متعدد اللغات لا يعالجه أي نموذج تجاري حالي بشكل كافٍ.
Hadretna: أول نموذج ذكاء اصطناعي لهجي جزائري
المبادرة الجزائرية الأبرز في الذكاء الاصطناعي اللغوي العربي هي Hadretna (بمعنى “حضرتنا” أي لهجتنا)، مشروع بحثي أسسته الشركة الناشئة الجزائرية-الفرنسية Fentech بالتعاون مع البروفيسور Merouane Debbah — رئيس المجلس الوطني للذكاء الاصطناعي في الجزائر والمدير المؤسس لمركز أبحاث الجيل السادس في جامعة Khalifa بأبوظبي.
قام Hadretna بتدريب مسبق لنموذج لغوي كبير على 2 مليار رمز من بيانات الدارجة والأمازيغية، ليكون أول نموذج يستهدف تحديداً العربية الجزائرية. أطلق المشروع مبادرة تعهيد جماعي لجمع بيانات المحادثة بالعربية الجزائرية من متحدثين أصليين، لبناء مجموعة تدريب تلتقط الأنماط الحقيقية لتواصل الجزائريين — وليس الفصحى الرسمية التي تهيمن على مجموعات بيانات معالجة اللغة العربية الحالية.
التطبيقات عملية فوراً: روبوتات خدمة العملاء التي تفهم المتصلين الجزائريين، بوابات الخدمات الحكومية التي تعالج استفسارات المواطنين بلغة طبيعية، أدوات تعليمية مكيفة لطريقة حديث الطلاب الجزائريين، وأدوات تحليل إعلامي لمراقبة وسائل التواصل الاجتماعي باللهجات المحلية. يقوم القطاع العام الجزائري حالياً برقمنة أكثر من 342 خدمة عبر بوابة Bawabatak عبر 25 وزارة، مما يخلق سوق مشتريات حيث للذكاء الاصطناعي القادر على فهم الدارجة قيمة تجارية مباشرة.
البحث الجامعي يغذي المسار
مجتمع معالجة اللغة الطبيعية الأكاديمي الجزائري، رغم صغره، ينتج أعمالاً ذات أهمية دولية. يقود الدكتور طه زروقي في جامعة البويرة أحد أكثر برامج البحث في معالجة اللغة الطبيعية احتراماً في البلاد، منتجاً أدوات مفتوحة المصدر تشمل Mishkal — مشكّل نصوص يضيف علامات التشكيل إلى النص العربي غير المشكول — وTashaphyne، محلل صرفي أساسي لمعالجة النص العربي.
تعالج هذه الأدوات تحدياً جوهرياً في معالجة اللغة العربية: النص العربي يُكتب عادةً بدون حركات قصيرة، مما يخلق غموضاً هائلاً للمعالجة الحاسوبية. الهيكل الساكن الواحد يمكن أن يمثل كلمات متعددة بمعانٍ مختلفة تماماً. أدوات مثل Mishkal تحل هذا الغموض، مما يمكّن تطبيقات لاحقة من محركات البحث إلى المساعدين الصوتيين.
تساهم جامعات بسكرة وقسنطينة والجزائر العاصمة بأبحاث إضافية في تحليل المشاعر العربي والتعرف على الكيانات المسماة والترجمة الآلية — لبنات أساسية تغذي تطوير نماذج اللغة الأكبر.
إعلان
المنافسة الإقليمية تشتد
تندرج جهود الجزائر في الذكاء الاصطناعي العربي ضمن مشهد إقليمي يتصاعد بسرعة. طورت SDAIA في المملكة العربية السعودية نموذج ALLaM، نموذج لغوي عربي كبير مدرب على أكثر من 500 مليار رمز عربي، متوفر بإصدارات 7 و13 و70 مليار معامل. حقق ALLaM المرتبة الأولى في معيار Arabic MMLU ومنشور على منصتي IBM Watsonx وMicrosoft Azure.
طور معهد الابتكار التكنولوجي في الإمارات نموذج Jais، نموذج لغوي عربي كبير آخر، بينما تبني عدة مبادرات ممولة خليجياً نماذج قادرة على العربية بميزانيات حوسبة تفوق بكثير ما هو متاح في شمال أفريقيا.
لكن هذه النماذج المطورة في الخليج تشترك في قيد مهم: هي محسّنة للهجات الخليجية والفصحى، مع أداء ضعيف على المتغيرات العربية شمال الأفريقية. الدارجة الجزائرية، باقتراضاتها المعجمية الكثيفة من الفرنسية وأنماطها الصوتية المميزة، هي فعلياً نقطة عمياء لهذه النماذج. هذا يخلق فرصة سوقية حقيقية للحلول المطورة في الجزائر.
قيود البنية التحتية والحلول البديلة
يتطلب بناء نماذج لغوية تنافسية موارد حاسوبية كبيرة. تواجه الجزائر قيوداً خاصة: الوصول إلى وحدات GPU لتدريب النماذج الكبيرة محدود بقيود الاستيراد والتكلفة، وتعتمد فرق البحث غالباً على الحوسبة السحابية المقيدة بالرقابة على العملة وعوائق الدفع الدولي.
مركز الحوسبة الفائقة للذكاء الاصطناعي قيد الإنشاء في وهران — بمجموعات GPU لأحمال عمل الذكاء الاصطناعي — سيعالج جزئياً القيود الحاسوبية عند تشغيله. المنشأة مصممة لتوفير قدرات حوسبة مكثفة للباحثين والشركات الناشئة والمؤسسات لتطوير الذكاء الاصطناعي.
في الأثناء، يستخدم الباحثون الجزائريون حلولاً عملية: ضبط دقيق للنماذج متعددة اللغات الموجودة بدلاً من التدريب من الصفر، واستخدام تقنيات كفاءة المعاملات مثل LoRA التي تتطلب حوسبة أقل، والاستفادة من نماذج مفتوحة المصدر من Hugging Face كبنى أساسية. تخطط استراتيجية SNTN-2030 صراحةً لأكثر من 500 مشروع رقمي للفترة 2025-2026، مع تكنولوجيا اللغة بالذكاء الاصطناعي ضمن القطاعات ذات الأولوية.
حتمية السيادة الرقمية
الذكاء الاصطناعي اللغوي هو بطبيعته مسألة سيادة. عندما يتفاعل المواطنون مع الخدمات الحكومية عبر أنظمة ذكاء اصطناعي مبنية على نماذج أجنبية، فإن التكنولوجيا الأساسية تحدد أي لغات ولهجات وسياقات ثقافية مدعومة. دفعة الجزائر نحو ذكاء اصطناعي عربي محلي ليست مجرد تمرين تقني — إنها خطوة استراتيجية لضمان أن التحول الرقمي للبلاد لا يعتمد على أنظمة ذكاء اصطناعي لا تفهم كيف يتواصل الجزائريون.
الرهانات التجارية حقيقية. منتج ذكاء اصطناعي عربي موضوع بشكل جيد في 2026 قد يهيمن بحلول 2030. مع 342 خدمة حكومية قيد الرقمنة واستراتيجية SNTN-2030 التي تدعو لدمج الذكاء الاصطناعي في الخدمات العامة، فإن السوق المتاح لأدوات الذكاء الاصطناعي القادرة على معالجة الدارجة — خدمة العملاء، معالجة المستندات، التفاعل مع المواطنين — يُقدر بمئات الملايين من الدولارات.
الأسئلة الشائعة
ما هو Hadretna ومن يقف وراءه؟
Hadretna (“حضرتنا” أي لهجتنا) هو أول نموذج لغوي كبير يستهدف العربية الجزائرية (الدارجة) والأمازيغية. طورته الشركة الناشئة الجزائرية-الفرنسية Fentech بالتعاون مع البروفيسور Merouane Debbah، رئيس المجلس الوطني للذكاء الاصطناعي.
لماذا تعمل نماذج الذكاء الاصطناعي العربية الحالية بشكل سيء مع العربية الجزائرية؟
النماذج المطورة في الخليج مثل ALLaM وJais محسنة للهجات الخليجية والعربية الفصحى الحديثة. الدارجة الجزائرية لها أنماط صوتية مميزة واقتراضات معجمية كثيفة من الفرنسية وسلوكيات تبديل اللغة لم تُدرَّب هذه النماذج على التعامل معها.
ما البنية التحتية التي تمتلكها الجزائر لتدريب نماذج لغوية بالذكاء الاصطناعي؟
تبني الجزائر مركز حوسبة فائقة للذكاء الاصطناعي في وهران بمجموعات GPU. حتى يصبح جاهزاً، يعتمد الباحثون على الحوسبة السحابية وتقنيات كفاءة المعاملات مثل LoRA لضبط النماذج الموجودة بموارد محدودة.
المصادر والقراءات الإضافية
- The Landscape of Arabic Large Language Models — Communications of the ACM
- North African AI Researchers Crowdsource Arabic Language Data — Middle East AI News
- SDAIA Lists ALLaM 7B Arabic Language Model on Hugging Face — Asharq Al-Awsat
- Arabic LLM Models — Hugging Face Blog
- A Survey of Large Language Models for Arabic Language and Its Dialects — ResearchGate














