الذكاء الاصطناعيالأمن السيبرانيالبنية التحتيةالمهاراتالسياسةالشركات الناشئةالاقتصاد الرقمي

معالجة اللغة العربية الطبيعية للحكومة الإلكترونية الجزائرية: كيف يمكن لتحليل المشاعر وأتمتة المستندات تحويل الخدمات العامة

فبراير 26, 2026

arabic-nlp-sentiment-egovernment-automation featured image

التحدي متعدد اللغات للخدمات الحكومية الجزائرية

كل يوم، تعالج الإدارة العامة الجزائرية ملايين التفاعلات مع المواطنين — طلبات شهادات الميلاد وطلبات السكن وتسجيلات الشركات والشكاوى والاستفسارات. تتدفق هذه التفاعلات عبر شبكة متنامية من بوابات الحكومة الإلكترونية، بلغت ذروتها مع إطلاق Dzair Services في 2025، وهي منصة وطنية صُممت لتمركز جميع الخدمات العامة الرقمية عبر 46 وزارة وهيئة متصلة الآن بالألياف البصرية. تضم استراتيجية الجزائر الرقمية 2030 أكثر من 500 مشروع قيد التنفيذ بين 2025 و2026، منها 75% تركز تحديداً على تحديث الخدمات العامة وتبسيط الإجراءات الإدارية.

الواقع اللغوي لهذه التفاعلات معقد بشكل استثنائي. يكتب المواطنون بالعربية الفصحى الحديثة (MSA) والدارجة الجزائرية (لهجة عربية محكية بتأثيرات أمازيغية وفرنسية وتركية قوية) والفرنسية، وكثيراً بمزيج من الثلاثة في رسالة واحدة. التبديل اللغوي — التنقل بين اللغات في منتصف الجملة — هو القاعدة وليس الاستثناء. شكوى مواطن نموذجية قد تمزج الدارجة والفرنسية والفصحى بطرق لا يمكن لأي نظام حكومي حالي معالجتها أو تصنيفها أو استخراج معناها آلياً.

النتيجة: ملاحظات المواطنين تبقى غير محللة في قواعد البيانات، وتوجيه الشكاوى يعتمد على القراءة اليدوية من قبل موظفين مثقلين، والقيادة الحكومية تفتقر لرؤية آنية حول رضا المواطنين. هذه بالضبط المشكلة التي يمكن لمعالجة اللغة العربية الطبيعية — خاصة المعالجة الواعية باللهجات — حلها.

حالة معالجة اللغة العربية والدارجة في 2026

تقدمت معالجة اللغة العربية الطبيعية بشكل كبير في السنوات الأخيرة، لكن الدارجة الجزائرية تبقى من أكثر اللهجات إهمالاً. التحدي الأساسي أن الدارجة ليس لها شكل كتابي موحد — هي أساساً لغة محكية تُكتب صوتياً بالخط العربي أو اللاتيني (عربيزي) أو مزيج منهما. هذه الفوضى الإملائية تجعل التقطيع (tokenization)، الخطوة الأولى في أي خط أنابيب لمعالجة اللغة، صعباً للغاية.

حققت أبحاث جزائرية تقدماً ملحوظاً. مكتبة Tashaphyne للدكتور طه زروقي، وهي أداة تجذيع خفيفة للعربية مفتوحة المصدر وجزء من إطار Adawat الأوسع لمعالجة النصوص العربية، كانت لبنة أساسية لأبحاث معالجة اللغة العربية. طوّر أيضاً Qalsadi للتحليل الصرفي وMishkal لاستعادة التشكيل العربي. حديثاً، وفّر AraBERT من الجامعة الأمريكية في بيروت وCAMeLBERT من مختبر CAMeL في NYU Abu Dhabi نماذج محول (transformer) مدربة مسبقاً للعربية، رغم أن أداءها على الدارجة الجزائرية تحديداً يتخلف عن الفصحى ولهجات الخليج. يمثل نموذج DziriBERT، الذي طوره الباحثون الجزائريون Abdaoui وBerrimi وOussalah وMoussaoui، أول نموذج مبني على BERT مدرب تحديداً على بيانات اللهجة الجزائرية — مستمداً من أكثر من مليون تغريدة جزائرية لالتقاط الأنماط اللغوية الفريدة للتعبير الجزائري، ومحققاً نتائج رائدة في تصنيف النصوص الجزائرية رغم تدريبه على 150 ميغابايت فقط من البيانات.

غيّر ظهور نماذج اللغات الكبيرة (LLM) المشهد أكثر. Jais، نموذج اللغة العربي مفتوح المصدر الذي طوره Inception التابع لـ G42 وMBZUAI في الإمارات، تطور من 13 إلى 70 مليار معامل وتدرب على 116 مليار رمز عربي إلى جانب 279 مليار رمز إنجليزي. تُظهر نماذج مثل Jais وGPT-4 وClaude فهماً معقولاً للدارجة في وضع zero-shot، لكن أداءها في مهام معالجة اللغة الحكومية المحددة — استخراج الكيانات وتصنيف الشكاوى وتقييم المشاعر — يتطلب ضبطاً دقيقاً على بيانات خاصة بالمجال. عنق الزجاجة الحرج هو غياب مجموعات بيانات نصية حكومية جزائرية مُعلّمة.

إعلان

التطبيقات العملية: من توجيه الشكاوى إلى لوحات المتابعة

التطبيق الأكثر قابلية للنشر فوراً لمعالجة اللغة في الخدمات الحكومية الجزائرية هو التصنيف والتوجيه الآلي للشكاوى. حالياً، عندما يقدم مواطن شكوى عبر بوابة الولاية، يقرأها موظف، يحدد الإدارة المعنية (إسكان، طرق، مياه، تعليم)، ويحيلها يدوياً. تستغرق هذه العملية أياماً وعُرضة للأخطاء. مصنف معالجة لغة مدرب على بيانات الشكاوى التاريخية يمكنه توجيه الطلبات في ثوانٍ، بمعدلات دقة تشير المعايير الدولية إلى تجاوزها 85% حتى للمدخلات متعددة اللغات.

تمثل لوحات تحليل المشاعر تطبيقاً أعلى تأثيراً لكن أكثر طموحاً. تخيل لوحة متابعة آنية حيث يمكن لوالي كل ولاية رؤية اتجاهات مشاعر المواطنين: شكاوى الإسكان المتصاعدة في بلدية محددة، رضا خدمة المياه المتراجع على مدى ثلاثة أشهر، المشاعر الإيجابية حول مشروع طريق جديد. نشرت عدة دول خليجية تحليل المشاعر العربي عبر منصات ملاحظات المواطنين.

تقدم أتمتة المستندات محوراً ثالثاً. تتعامل الهيئات الحكومية الجزائرية مع أحجام هائلة من المستندات العربية والفرنسية: نصوص قانونية ومراسلات إدارية وشهادات ميلاد ووفاة وسندات ملكية وسجلات قضائية. يمكن لمعالجة المستندات بمعالجة اللغة استخراج الكيانات الرئيسية وتوليد ملخصات آلية وكشف التكرارات والإشارة إلى الشذوذات.

خريطة طريق التنفيذ والمتطلبات المؤسسية

يتطلب نشر معالجة اللغة العربية في الخدمات الحكومية الجزائرية أكثر من التقنية — يتطلب بنية تحتية مؤسسية. المتطلب الأول هو حوكمة البيانات. يجب على الهيئات الحكومية وضع بروتوكولات لجمع وإخفاء هوية وتعليم بيانات تفاعل المواطنين. هذا تحدٍ تقني وقانوني في آن واحد، حيث يفرض قانون حماية البيانات الجزائري (القانون 18-07) قيوداً على معالجة البيانات الشخصية يجب التعامل معها بعناية.

المتطلب الثاني هو القدرة الحاسوبية المحلية. مخاوف السيادة تجعل من غير المرجح معالجة البيانات الحكومية الحساسة على بنية سحابية أجنبية. المنظومة المتنامية لمراكز البيانات الجزائرية — بما في ذلك المركز الوطني في المحمدية ومنشأة ثانية قيد البناء في البليدة — يمكنها استضافة نماذج معالجة لغة محلياً. طبيعة المصدر المفتوح لنماذج مثل DziriBERT وAraBERT وJais تجعل النشر المستضاف ذاتياً ممكناً، لكن الخبرة التشغيلية تبقى نادرة.

المسار الأكثر وعداً هو نهج تجريبي تدريجي. البدء بولاية واحدة — الجزائر العاصمة نظراً لحجمها وبنيتها الرقمية القائمة — ونشر تصنيف الشكاوى بمعالجة اللغة على بوابة Dzair Services. قياس الدقة وجمع الملاحظات وتحسين النماذج ثم التوسع. بالتوازي، الشراكة مع الجامعات الجزائرية (ESI وUSHTB وجامعة البويرة حيث يعمل مبتكر Tashaphyne) لبناء مجموعات البيانات المُعلّمة بالدارجة التي ستحسن أداء النماذج بمرور الوقت. تحتل الجزائر حالياً المرتبة 116 من 193 دولة في مؤشر الأمم المتحدة لتطوير الحكومة الإلكترونية — تحديث الخدمات بمعالجة اللغة الطبيعية يمكن أن يحسن هذا الترتيب بشكل ملموس.

إعلان

🧭 رادار القرار

البُعد التقييم
الأهمية بالنسبة للجزائر عالية جداً — ملايين تفاعلات المواطنين تبقى غير محللة؛ معالجة اللغة تعالج مباشرة استجابة وشفافية الحكومة
جاهزية البنية التحتية جزئية — منصة Dzair Services ومراكز البيانات موجودة، لكن بنية GPU ومجموعات البيانات المُعلّمة تحتاج تطويراً
الكفاءات المتاحة ناشئة — مجتمع بحثي نشط في معالجة اللغة العربية (Zerrouki، فريق DziriBERT)، لكن مهارات هندسة الإنتاج محدودة
الجدول الزمني 6–12 شهراً لتجربة تصنيف الشكاوى؛ 18–24 شهراً للوحات المشاعر؛ 3+ سنوات لأتمتة المستندات الشاملة
الأطراف المعنية الرئيسية وزارة الاقتصاد الرقمي، وزارة الداخلية (الولايات)، ESI، USTHB، جامعة البويرة، مجتمع بحث معالجة اللغة الجزائري
نوع القرار استراتيجي
مستوى الأولوية عالٍ

خلاصة سريعة: معالجة اللغة العربية للخدمات الحكومية الجزائرية ممكنة تقنياً اليوم لكنها معطلة مؤسسياً. المسار الحرج يمر عبر بناء مجموعات بيانات مُعلّمة بالدارجة وتشغيل تجربة مركزة في ولاية واحدة عبر منصة Dzair Services. تمتلك الجزائر ميزة فريدة في مجتمعها البحثي النشط في معالجة اللغة — الفجوة ليست في الكفاءات بل في الجسر بين البحث الأكاديمي والنشر الحكومي.

المصادر والقراءات الإضافية

Leave a Comment

إعلان