⚡ أبرز النقاط

2B — tokens in Hadretna’s Darija training corpus

الخلاصة: Hadretna builds the first Algerian Darija LLM as Gulf models fail on North African Arabic dialects

اقرأ التحليل الكامل ↓

إعلان

🧭 رادار القرار

الصلة بالجزائر
عالية

عالية
الجدول الزمني للعمل
6-12 شهراً

6-12 شهراً
أصحاب المصلحة ا��رئيسيون
باحثو الذكاء الاصطناعي، شركات معالجة اللغة الناشئة، وزارة الاقتصاد الرقمي، المجلس الوطني للذكاء ��لاصطناعي، خدمات Sonatrach الرقمية

باحثو الذكاء الاصطناعي، شركات معالجة اللغة الناشئة، وزارة الاقتصاد الرقمي، المجلس الوطني للذكاء ��لاصطناعي، خدمات Sonatrach الرقمية
نو�� القرار
استراتيجي

استراتيجي
مستوى الأولوية
مرتفع

مرتفع

خلاصة سريعة: تمتلك الجزائر ميزة تنافسية حقيقية في الذكا�� الاصطناعي العربي شمال الأفريقي لا تستطيع النماذج الخليجية مجاراتها. على الشركات الناشئة استكشاف تطبيقات معالجة ��للغة الخاصة بالدارجة، بينما ينبغي للمؤسسات التي ترقمن خدمات العملاء تقييم القدرات اللغوية المحلية.

الخلاصة الرئيسية: تشق الجزائر طريقها في مجال الذكاء الاصطناعي باللغة العربية — من مشروع Hadretna الذي يبني أول نموذج لغوي كبير خاص بالدارجة إلى أدوات معالجة اللغة الجامعية مثل Mishkal — بينما تشتد المنافسة العالمية مع ضخ دول الخليج مليارات في تكنولوجيا اللغة السيادية.

الفجوة في الذكاء الاصطناعي العربي التي يمكن للجزائر سدها

يتحدث العربية أ��ثر من 400 مليون شخص، لكنها تبقى من أكثر اللغات المهملة في مجال الذكاء الاصطناعي. تُظهر نماذج اللغة الكبيرة الحالية فجوات أداء كبيرة في المهام العربية، مع تمثيل ضعيف بشكل خاص للهجات شمال أفريقيا. الفجوة بين العربية الفصحى الحديثة (MSA) — السجل الكتابي الرسمي — والهجات المحكية المتنوعة تخلق تحدياً تقنياً لا تستطيع النماذج متعددة اللغات العامة حله.

تقف الجزائر عند مفترق طرق فريد. مع سكان يتنقلون بين الدار��ة (العربية الجزائرية) والفرنسية والأمازيغية والفصحى — غالباً في محادثة واحدة — فإن التعقيد اللغوي للبلاد هو تحدٍ وفرصة في آن واحد.

Hadretna: أول نموذج ذكاء اصطناعي لهجي جزائري

المبادرة الجزائرية الأبرز في الذكاء الاصطناعي اللغوي العربي هي Hadretna (بمعنى “حضرتنا” أي لهجتنا)، مشروع بحثي أسسته الشركة الناشئة الجزائرية-الفرنسية Fentech بالتعاون مع البروفيسور Merouane Debbah — رئيس المجلس الوطني للذكاء الاصطناعي ��ي الجزائر والمدير المؤسس لمركز أبحاث الجيل السادس في جامعة Khalifa بأبوظبي.

قام Hadretna بتدريب مسبق لنموذج لغوي كبير على 2 مليار رمز من بيانات الدارجة والأمازيغية، ليكون أول نموذج يستهدف تحديداً العربية الجزائرية. أطلق المشروع مبادرة تعهيد جماعي لجمع بيانات المحادثة بالعربية الجزائرية من متحدثين أصليين.

التطبيقات عملية فوراً: روبوتات خدمة العملاء التي تفهم المتصلين الجزائريين، بوابات الخدمات الحكومية التي تعالج استفسارات المواطنين بلغة طبيعية، وأدوات تعليمية مكيفة لطريقة حديث الطلاب الجزائريين. يقوم القطاع العام الجزائري حالياً برقمنة أكثر من 342 خدمة عبر بوابة Bawabatak عبر 25 وزارة، مما يخلق سوق شراء حيث للذكاء الاصطناعي القادر على فهم الدارجة قيمة تجارية مباشرة.

البحث الجامعي يغذي المسار

مجتمع معالجة اللغة الطبيعية الأكاديمي الجزائري، رغم صغره، ينتج أعمالاً ذات أهمية دولية. يقود الدكتور طه زروقي في جامعة البويرة أحد أكثر برامج البحث في معالجة اللغة الطبيعية احتراماً في البلاد، منتجاً أدوات مفتوحة المصدر تشمل Mishkal — مشكّل نصوص يضيف علامات التشكيل إلى النص العربي غير المشكول — وTashaphyne، محلل صرفي أساسي لمعالجة النص العربي.

تعالج هذه الأدوات تحدياً جوهرياً في معالجة اللغة العربية: النص العربي يُكتب عادةً بدون حركات قصيرة، مما يخلق غموضاً هائلاً للمعالجة الحاسوبية.

إعلان

المنافسة الإقليمية تشتد

تندرج جهود الجزائر في الذكاء الاصطناعي العربي ضمن مشهد إقليمي يتصاعد بسرعة. طورت SDAIA في المملكة العربية السعودية نموذج ALLaM، نموذج لغوي عربي كبير مدرب على أكثر من 500 مليار رمز عربي، متوفر بإصدارات 7 و13 و70 مليار معامل. حقق ALLaM المرتبة الأولى في معيار Arabic MMLU ومنشور على منصتي IBM Watsonx وMicrosoft Azure.

طور معهد الابتكار التكنولوجي في الإمارات نموذج Jais، نموذج لغوي عربي كبير آخر. لكن هذه النماذج المطورة في الخليج تشترك في قيد مهم: هي مُحسَّنة للهجات الخليجية والفصحى، مع أداء ضعيف على المتغيرات العربية شمال الأفريقية. الدارجة الجزائرية، بإقتراضاتها المعجمية الكثيفة من الفرنسية وأنماطها الصوتية المميزة، هي فعلياً نقطة عمياء لهذه النماذج.

قيود البنية التحتية والحلول البديلة

يتطلب بناء نماذج لغوية تنافسية موارد حاسوبية كبيرة. تواجه الجزائر قيوداً خاصة: الوصول إلى وحدات GPU لتدريب النماذج الكبيرة محدود بقيود الاستيراد والتكلفة، وتعتمد فرق البحث على الحوسبة السحابية المقيدة بالرقابة على العملة.

مركز الحوسبة الفائقة للذكاء الاصطناعي قيد الإنشاء في وهران — بمجموعات GPU لأحمال عمل الذكاء ال��صطناعي — سيعالج جزئياً القيود الحاسوبية عند تشغيله. في الأثناء، يستخدم الباحثون الجزائريون حلولاً عملية: ضبط دقيق للنماذج متعددة اللغات الموجودة، واستخدام تقنيات كفاءة المعاملات مثل LoRA، والاستفادة من نماذج مفتوحة المصدر من Hugging Face.

حتمية السيادة الرقمية

الذكاء الاصطناعي اللغوي هو بطبيعته مسألة سيادة. عندما يتفاعل المواطنون مع الخدمات الحكومية عبر أنظمة ذكاء اصطناعي مبنية على نماذج أجنبية، فإن التكنولوجيا الأساسية تحدد أي لغات وسياقات ثقافية مدعومة. دفعة الجزائر نحو ذكاء اصطناعي عربي محلي ليست مجرد تمرين تقني — إنها خطوة استراتيجية لضمان أن التحول الرقمي للبلاد لا يعتمد على أنظمة لا تفهم كيف يتواصل الجزائريون.

الرهانات التجارية حقيقية. مع 342 خدمة حكومية قيد الرقمنة واستراتيجية SNTN-2030 التي تدعو لدمج الذكاء الاصطناعي في الخدمات العامة، فإن السوق المتاح لأدوات الذكاء الاصطناعي القادرة على معالجة الدارجة يُقدر بمئات الملايين من الدولارات.

الم��ادر والقراءات ال��ضافية

تابعوا AlgeriaTech على LinkedIn للتحليلات التقنية المهنية تابعوا على LinkedIn
تابعونا @AlgeriaTechNews على X للحصول على أحدث تحليلات التكنولوجيا تابعنا على X

إعلان

الأسئلة الشائعة

ما هو Hadretna ومن يقف وراءه؟

Hadretna (“حضرتنا” أي لهجتنا) هو أول نموذج لغوي كبير يستهدف العربية الجزائرية (الدارجة) والأمازيغية. طورته الشركة الناشئة الجزائرية-الفرنسية Fentech بالتعاون مع البروفيسور Merouane Debbah، رئيس المجلس الوطني للذكاء الاص��ناعي.

لماذا تعمل نماذج الذكاء الاصطناعي العربية الحالية بشكل سيء مع العربية الجزائرية؟

النماذج المطورة في الخليج مثل ALLaM وJais محسنة للهجات الخليجية والعربية الفصحى الحديثة. الدارجة الجزائرية لها أنماط صوتية مميزة واقتراضات معجمية كثيفة من الفرنسية وسلوكيات تبديل اللغة لم تُدرَّب هذه النماذج على التعامل معها.

ما البنية التحتية التي تمتلكها الجزائر لتدريب نماذج لغوية بالذكاء الاصطناعي؟

تبني الجزائر مركز حوسبة فائقة للذكاء الاصطناعي في وهران بمجموعات GPU. حتى يصبح جاهزاً، يعتمد الباحثون على الحوسبة السحابية وتقنيات كفاءة المعاملات مثل LoRA لضبط النماذج الموجودة بموارد محدودة.
///