⚡ أبرز النقاط

  • تمثل العربية أقل من 1% من بيانات تدريب نماذج اللغة الكبرى الرئيسية، واللهجات المغاربية هي الأقل تمثيلاً. الباحثون الجزائريون يرسمون معالمهم: Hadretna دربت نموذج لغة كبير على 2 مليار token من الدارجة والأمازيغية، وDziriBERT قدم أول نموذج Transformer للعربية الجزائرية، وNojoom.ai تبني أدوات ذكاء اصطناعي للمؤسسات منها محرك البحث العربي Thuraya. مع 48 مليون نسمة و74 برنامج ماجستير مرتبط بالذكاء الاصطناعي وأصول لغوية فريدة في الدارجة والأمازيغية، تمتلك الجزائر ميزة الريادة في سوق لا ينافسها فيه أحد تقريباً.

خلاصة: استكشفوا شراكات مع Hadretna وNojoom.ai الآن — سوق الذكاء الاصطناعي للهجات العربية مفتوح على مصراعيه والجزائر تملك الكفاءات لقيادته.

اقرأ التحليل الكامل ↓

إعلان

🧭 رادار القرار

الأهمية بالنسبة للجزائرعالية
تمتلك الجزائر ميزة المتحرك الأول في الذكاء الاصطناعي للدارجة والأمازيغية، وهو سوق بلا منافسة تقريباً
الجدول الزمني للعملفوري
Hadretna وNojoom.ai يبنيان بالفعل؛ نافذة التموضع المبكر مفتوحة الآن
أصحاب المصلحة الرئيسيونباحثو معالجة اللغة الطبيعية، مؤسسو الشركات الناشئة في الذكاء الاصطناعي، مستثمرو تكنولوجيا اللغة، فرق الرقمنة الحكومية، تقنيو المهجر
نوع القراراستراتيجي
يتطلب تخطيطاً استراتيجياً وقرارات على مستوى القيادة تحدد التوجه المستقبلي
مستوى الأولويةعالٍ
يتطلب ترتيباً مناسباً للأولويات ضمن التخطيط المؤسسي

خلاصة: سوق الذكاء الاصطناعي للهجات العربية مفتوح على مصراعيه، والجزائر تمتلك المواهب البحثية والأصول اللغوية للسيطرة عليه. ينبغي للشركات الناشئة استكشاف شراكات مع Hadretna وNojoom.ai. وعلى المستثمرين تقييم فضاء الذكاء الاصطناعي العربي في شمال أفريقيا قبل أن يدخله اللاعبون الدوليون. مع إثبات DziriBERT لجدوى النماذج المخصصة للهجات ودعم صندوق اتصالات الجزائر للمشاريع في الذكاء الاصطناعي، بات دعم المنظومة حقيقياً — وليس مجرد طموح.

الحدود القادمة لنماذج اللغة الكبيرة (LLM) ليست الإنجليزية. وليست حتى الصينية الماندرينية. بالنسبة لعدد متزايد من الباحثين ورواد الأعمال، فإن أعظم فرصة غير مستغلة في الذكاء الاصطناعي تكمن في أكثر من 400 مليون متحدث بالعربية ولهجاتها الإقليمية — والباحثون الجزائريون يضعون بهدوء أقدامهم على هذا الميدان.

الجزائر، بنحو 48 مليون نسمة، هي أكبر دولة ناطقة بالعربية مساحة وثالث أكبرها سكاناً. مشهدها اللغوي معقد بشكل غير اعتيادي: العربية الفصحى الحديثة (MSA) هي اللغة الرسمية، لكن التواصل اليومي يحدث بشكل ساحق بـالدارجة (العربية الجزائرية) — لهجة محكية ذات تأثيرات أمازيغية وفرنسية وعثمانية تركية قوية، وهي غائبة إلى حد بعيد عن النصوص الرقمية المكتوبة. إلى جانب الدارجة، يُتحدث الأمازيغية (اللغة البربرية المعترف بها كلغة وطنية ورسمية منذ 2016) من قبل ما يقدر بـ 25 إلى 30% من السكان عبر متغيرات إقليمية متعددة تشمل القبائلية والشاوية والميزابية والتارقية. هذا التنوع اللغوي يخلق تحدياً فريداً وفرصة فريدة للذكاء الاصطناعي في آن واحد.

فجوة معالجة اللغة العربية الطبيعية

المساعدات الذكية الحديثة مثل ChatGPT وGemini وClaude تؤدي بشكل أضعف بكثير باللغة العربية مقارنة بالإنجليزية. السبب الجذري هو البيانات: فقد دُرّبت هذه النماذج أساساً على محتوى إنجليزي من الإنترنت. والعربية، رغم كونها خامس أكثر اللغات تحدثاً عالمياً، تمثل أقل من 1% من بيانات التدريب في معظم نماذج اللغة الكبيرة الرئيسية. وتتفاقم المشكلة عند النظر إلى العربية الدارجة: الدارجة والأمازيغية لا تكاد تكون ممثلتين على الإطلاق.

أكدت أبحاث نُشرت في Communications of the ACM عام 2025 أن نماذج اللغة العربية الكبيرة الحالية تُظهر فجوات أداء كبيرة في مهام العربية الدارجة مقارنة بالعربية الفصحى الحديثة، وأن لهجات شمال أفريقيا تعاني من نقص خدمة خاص. كشفت دراسة تقييم منفصلة على arXiv أن حتى النماذج المتخصصة في العربية تواجه صعوبات في المهام التي تتطلب الفهم الدارجي وتحليل المشاعر في الأصناف الإقليمية والتبديل بين العربية والفرنسية — وهي ظاهرة تُعرّف التواصل الرقمي الجزائري اليومي.

السياق العالمي يتغير بسرعة مع ذلك. لاعبون إقليميون كبار يستثمرون بكثافة في الذكاء الاصطناعي العربي: معهد الابتكار التكنولوجي في الإمارات طوّر Jais 2، نموذج ثنائي اللغة عربي-إنجليزي؛ و SDAIA السعودية أنشأت ALLaM لفهم اللغة العربية؛ وجهود أكاديمية مثل AceGPT (من هونغ كونغ) استهدفت اتباع التعليمات بالعربية. لكن لا أحد من هذه النماذج يخدم الدارجة الجزائرية أو الأمازيغية بشكل كافٍ — فهي مُحسّنة للعربية الخليجية أو الفصحى الحديثة، مما يترك فجوة كبيرة للهجات شمال أفريقيا.

Hadretna: رائد نماذج اللغة الكبيرة في الجزائر

أهم جهد لسد هذه الفجوة هو مشروع Hadretna (“حضرتنا” أي “لهجتنا” بالعربية). أطلقته الشركة الناشئة الجزائرية-الفرنسية Fentech بالشراكة مع عالم الذكاء الاصطناعي البروفيسور Merouane Debbah — رئيس المجلس العلمي الوطني للذكاء الاصطناعي في الجزائر والمدير المؤسس لمركز أبحاث 6G في جامعة Khalifa في أبوظبي — وقد حقق Hadretna ما يلي:

  • تدريب مسبق لـنموذج لغوي كبير على 2 مليار رمز (token) من بيانات الدارجة والأمازيغية — أول نموذج من نوعه يستهدف العربية الجزائرية تحديداً
  • إطلاق مبادرة تعهيد جماعي عامة لجمع بيانات المحادثات بالعربية الجزائرية من متحدثين أصليين
  • التموضع كنموذج أساسي لتطبيقات خدمة العملاء والتعليم والخدمات الحكومية والإعلام

الآثار المترتبة كبيرة. أي شركة ترغب في نشر خدمة عملاء أو روبوتات محادثة مدعومة بالذكاء الاصطناعي عبر الجزائر تحتاج إلى نموذج يفهم الطريقة التي يتحدث بها الجزائريون فعلاً — وليس العربية الفصحى المكتوبة للنصوص الرسمية. الفجوة بين الفصحى الحديثة والدارجة تُقارن غالباً بالفجوة بين اللاتينية والإيطالية الحديثة: المعيار المكتوب والواقع المنطوق هما لغتان مختلفتان جوهرياً لأغراض الذكاء الاصطناعي.

نهج التعهيد الجماعي في Hadretna مهم بشكل خاص. على عكس الإنجليزية حيث توجد مليارات الكلمات من النصوص على الويب للتدريب، فإن الدارجة شفهية في الغالب. توفر وسائل التواصل الاجتماعي بعض المحتوى المكتوب بالدارجة (غالباً في مزيج من الكتابة العربية واللاتينية و”العربيزي” — العربية مكتوبة بحروف لاتينية وأرقام)، لكن هذه البيانات مشوّشة وغير متسقة وتتطلب تنظيفاً كبيراً. بناء مجموعات بيانات تدريب عالية الجودة يتطلب جهداً بشرياً متعمداً.

Nojoom.ai: الذكاء الاصطناعي التجاري، صُنع في الجزائر

بالتوازي، تقدم Nojoom.ai نفسها بوصفها “أول منصة ذكاء اصطناعي توليدي جزائرية 100%”. وتشمل منتجاتها:

  • Thuraya: محرك بحث عربي مدعوم بالذكاء الاصطناعي مصمم لمنافسة Google Search في الأسواق الناطقة بالعربية
  • Suhail: أداة لتحليل المستندات وتلخيصها موجهة للمستخدمين من الشركات والجهات الحكومية
  • Nitaq: مساعد ذكاء اصطناعي سياقي لسير عمل المؤسسات

تُعد Nojoom.ai من أكثر الشركات الناشئة الجزائرية في مجال الذكاء الاصطناعي متابعة مع اقتراب عام 2026، بدعم من مستثمرين من القطاع الخاص واهتمام متزايد من عملاء القطاع العام. تركيز الشركة على حالات استخدام المؤسسات والحكومة — بدلاً من روبوتات الدردشة الاستهلاكية — يعكس فهماً براغماتياً لمكان وجود الإيرادات في السوق الجزائرية الحالية.

إعلان

المحرك الأكاديمي: من مختبرات الجامعات إلى الأدوات مفتوحة المصدر

الجامعات الجزائرية ليست مجرد متفرجة. أنتج البلد عدة مساهمات تأسيسية في معالجة اللغة العربية الطبيعية:

Dr. Taha Zerrouki في جامعة البويرة يقود أحد أكثر برامج أبحاث معالجة اللغة الطبيعية احتراماً في البلاد، مُنتجاً أدوات مفتوحة المصدر للغة العربية تشمل مُشكّل النصوص Mishkal (التشكيل التلقائي للنص العربي) والمحلل الصرفي Tashaphyne — أدوات يستخدمها مطورون وباحثون حول العالم. تعالج هذه المكتبات تحدياً جوهرياً في معالجة اللغة العربية الطبيعية: النص العربي يُكتب عادة بدون علامات الحركات القصيرة (التشكيل)، مما يخلق غموضاً هائلاً يجب على النماذج حله.

في مجال اللهجات تحديداً، يمثل DziriBERT — الذي طوّره باحثون من الجزائر وفرنسا — أول نموذج لغوي قائم على Transformer مُدرَّب مسبقاً تحديداً على العربية الجزائرية (الدزيرية). بُني على بنية BERT ودُرِّب على مدوّنة نصوص عامية جزائرية من وسائل التواصل الاجتماعي ومصادر الويب، وأظهر DziriBERT تحسينات ملموسة مقارنة بنماذج العربية المعيارية في مهام اللهجة الجزائرية بما في ذلك تحليل المشاعر وتصنيف المواضيع. واستكشف مشروع روبوت المحادثة المرافق DziriBOT الذكاء الاصطناعي التحاوري بالعربية الجزائرية.

خارج الجزائر، تشمل اللبنات الأساسية المهمة في معالجة اللغة العربية الطبيعية CAMeL Tools (مجموعة أدوات مفتوحة المصدر لمعالجة اللغة العربية من NYU Abu Dhabi) وAraBART (نموذج عربي تسلسلي لتلخيص النصوص). توفر هذه الأدوات بنية تحتية يمكن للباحثين الجزائريين البناء عليها بدلاً من البدء من الصفر.

مع 74 برنامج ماجستير مرتبط بالذكاء الاصطناعي عبر 52 جامعة وحوالي 57,700 طالب مسجل، تمتلك الجزائر خط الأنابيب الأكاديمي الخام. المدرسة الوطنية العليا للذكاء الاصطناعي (ENSIA) في سيدي عبد الله تُدرّب المهندسين تحديداً في معالجة اللغة الطبيعية ومعالجة الكلام والرؤية الحاسوبية. التحدي يكمن في ربط البحث الأكاديمي بالتطبيق التجاري — فجوة صُممت مراكز المهارات (Skills Centers) وصندوق اتصالات الجزائر للذكاء الاصطناعي (1.5 مليار دينار) وحاضنة DjazairIA لسدها.

لماذا يهم هذا شركات التكنولوجيا العالمية

بالنسبة لشركات التكنولوجيا الدولية، يمثل تطوير الذكاء الاصطناعي العربي في الجزائر إشارة تستحق الاهتمام:

  1. ميزة المتحرك الأول: سوق الذكاء الاصطناعي بالعربية الجزائرية شبه خالٍ من المنافسة. منتج محكم التموضع في 2026 قد يهيمن بحلول 2030.
  2. الامتداد الإقليمي: النماذج المدربة على العربية الجزائرية تنتقل جزئياً إلى اللهجات المغربية والتونسية والليبية — مما يفتح سوقاً شمال أفريقية تضم أكثر من 100 مليون شخص. اللهجات المغاربية تتقاسم مفردات وبنى نحوية مهمة لا تلتقطها نماذج العربية الخليجية.
  3. الطلب الحكومي: القطاع العام الجزائري يعمل بنشاط على رقمنة أكثر من 342 خدمة عبر بوابة Bawabatak في 25 دائرة وزارية. الواجهات العربية المدعومة بالذكاء الاصطناعي لخدمات المواطنين تمثل سوق مشتريات حكومية تُقدر بمئات الملايين من الدولارات. تُخطط استراتيجية SNTN-2030 صراحة لأكثر من 500 مشروع رقمي للفترة 2025-2026.
  4. توفر المواهب: على عكس المملكة العربية السعودية أو الإمارات، تمتلك الجزائر مجموعة كبيرة من باحثي الذكاء الاصطناعي الذين يظلون تنافسيين من حيث التكلفة مع امتلاكهم أسساً رياضية متينة. كشف استطلاع 2024 لمطوري الجزائر أن 60% من العاملين في شركات جزائرية لديهم بالفعل خيارات العمل عن بُعد — منظومة جاهزة للتعاون العابر للحدود.

المخاطر: شح البيانات ومحدودية الوصول إلى القدرة الحاسوبية

بناء ذكاء اصطناعي عربي لا يخلو من العقبات. العنق الضيق الأساسي هو البيانات. على عكس المحتوى الإنجليزي على الإنترنت، نادراً ما تُكتب الدارجة — فهي لغة محكية. إنشاء مجموعات بيانات التدريب يتطلب توسيماً بشرياً مكلفاً وتسجيلات صوتية ونسخاً كتابياً. مشكلة التبديل اللغوي (حيث يمزج الجزائريون بحرية بين العربية والفرنسية والأمازيغية في جملة واحدة) تجعل جمع البيانات والتوسيم أكثر تعقيداً.

يظل الوصول إلى وحدات معالجة الرسومات (GPU) لتدريب النماذج الكبيرة محدوداً في الجزائر بسبب قيود الاستيراد والتكلفة، رغم أن مركز الحوسبة الفائقة للذكاء الاصطناعي قيد الإنشاء في وهران — بمجموعات GPU لأعباء عمل الذكاء الاصطناعي — سيسد هذه الفجوة جزئياً عند تشغيله. في غضون ذلك، تعتمد فرق البحث على الحوسبة السحابية، المقيّدة بدورها بضوابط الصرف الجزائرية وحواجز الدفع الدولية. تنظيم PSP (تعليمة بنك الجزائر رقم 06-2025) وقيده على الدينار الجزائري يضيفان احتكاكاً إلى شراء وقت GPU السحابي من مزودين دوليين.

يُقدم الأمازيغية تحدياً إضافياً: بوصفها عائلة لغوية ذات متغيرات إقليمية متعددة وجهود توحيد حديثة فقط (إنشاء كتابة تيفيناغ الموحدة من IRCAM وعمل المحافظة السامية للأمازيغية (HCA) الجزائرية على نحو موحد)، فإن بيانات التدريب المتاحة تمثل جزءاً يسيراً مما هو موجود حتى للدارجة. أي نموذج ذكاء اصطناعي بالأمازيغية سيتطلب جهوداً متعمدة لبناء المدوّنات النصية، على الأرجح بدعم مؤسسي.

ومع ذلك، فإن المسار واضح. الجزائر تبني البنية التحتية — البشرية والمؤسسية والتقنية — لتصبح مركزاً رائداً للذكاء الاصطناعي بلغات شمال أفريقيا العربية. المؤسسات التي تدرك هذا المسار الآن ستكون في أفضل وضع عندما ينفتح السوق بالكامل.

تابعوا AlgeriaTech على LinkedIn للتحليلات التقنية المهنية تابعوا على LinkedIn
تابعونا @AlgeriaTechNews على X للحصول على أحدث تحليلات التكنولوجيا تابعنا على X

إعلان

الأسئلة الشائعة

لماذا تُعد الدارجة والأمازيغية قيّمتين لتطوير الذكاء الاصطناعي؟

هذه اللغات تمثل سوقاً ضخماً غير مخدوم. الدارجة الجزائرية وحدها لديها أكثر من 40 مليون متحدث بدون أدوات رقمية تقريباً، مما يخلق فرصاً في معالجة اللغة الطبيعية والتعرف على الكلام وتوليد المحتوى.

ما التحديات التقنية لبناء نماذج ذكاء اصطناعي بالعربية الجزائرية؟

التحديات الرئيسية هي نقص بيانات التدريب المصنّفة، والتناوب اللغوي بين الدارجة والفرنسية والفصحى، والتنوع اللهجي بين المناطق، ومحدودية موارد الحوسبة لتدريب النماذج الكبيرة محلياً.

كيف يمكن للمطورين الجزائريين المساهمة في منظومة الذكاء الاصطناعي بالدارجة؟

ببناء مجموعات بيانات مفتوحة المصدر، وإنشاء معايير تقييم للعربية الجزائرية، وتطوير تطبيقات عملية كالمساعدات الصوتية وأدوات الترجمة، والمساهمة في مشاريع دولية مثل Mozilla Common Voice.

الأسئلة الشائعة

لماذا تُعد الدارجة والأمازيغية قيّمتين لتطوير الذكاء الاصطناعي؟

هذه اللغات تمثل سوقاً ضخماً غير مخدوم. الدارجة الجزائرية وحدها لديها أكثر من 40 مليون متحدث بدون أدوات رقمية تقريباً، مما يخلق فرصاً في معالجة اللغة الطبيعية والتعرف على الكلام وتوليد المحتوى.

ما التحديات التقنية لبناء نماذج ذكاء اصطناعي بالعربية الجزائرية؟

التحديات الرئيسية هي نقص بيانات التدريب المصنّفة، والتناوب اللغوي بين الدارجة والفرنسية والفصحى، والتنوع اللهجي بين المناطق، ومحدودية موارد الحوسبة لتدريب النماذج الكبيرة محلياً.

كيف يمكن للمطورين الجزائريين المساهمة في منظومة الذكاء الاصطناعي بالدارجة؟

ببناء مجموعات بيانات مفتوحة المصدر، وإنشاء معايير تقييم للعربية الجزائرية، وتطوير تطبيقات عملية كالمساعدات الصوتية وأدوات الترجمة، والمساهمة في مشاريع دولية مثل Mozilla Common Voice.

المصادر والقراءات الإضافية