فجوة الإشراف في الفضاءات الرقمية الجزائرية
تضم الجزائر نحو 25.6 مليون مستخدم Facebook مع بداية 2025 وفقاً لـ DataReportal، مما يجعلها أحد أكبر أسواق Facebook في أفريقيا ومنطقة الشرق الأوسط وشمال أفريقيا. يغطي الوصول الإعلاني لـ Facebook نسبة 54.2% من إجمالي سكان الجزائر و83.5% من البالغين فوق 18 عاماً. المنصة ليست مجرد شبكة اجتماعية — إنها الساحة العامة الرقمية الرئيسية والسوق ومصدر الأخبار لملايين الجزائريين.
تحدي الإشراف على المحتوى على هذه المنصات حاد. ينتشر خطاب الكراهية الموجه ضد الأقليات العرقية (المجتمعات الأمازيغية، المهاجرون من جنوب الصحراء)، والتحريض الطائفي، والتضليل السياسي، والإعلانات الاحتيالية، والعنف البصري مع تدخل محدود من المنصات. يُبلغ المستخدمون الجزائريون بانتظام عن محتوى ينتهك بوضوح سياسات المنصة، ليتلقوا ردوداً آلية تفيد بأن المحتوى لا يخالف معايير المجتمع. الانفصال بين ما يختبره المستخدمون وما تطبقه المنصات خلق تشككاً واسعاً تجاه التزام شركات التقنية الكبرى بالأسواق غير الناطقة بالإنجليزية.
ما هو معروف: الإشراف على المحتوى باللغة العربية تلقى تاريخياً استثماراً أقل بكثير من الإنجليزية، وداخل العربية، كان التركيز على العربية الفصحى الحديثة (MSA) وأصناف عربية الخليج. الدارجة الجزائرية — صنف عربي متميز بتأثيرات أمازيغية وفرنسية وتركية وإسبانية — تسقط بين الشقوق. النتيجة هي نظام إشراف يمكنه كشف خطاب الكراهية بالفصحى لكنه يفوّت نفس المشاعر معبراً عنها بالدارجة، غالباً بمفردات وبنية نحوية مختلفة تماماً.
لماذا تكسر الدارجة أنظمة الإشراف بالذكاء الاصطناعي
تطرح الدارجة الجزائرية سلسلة من التحديات لأنظمة معالجة اللغة الطبيعية. الأول إملائي: الدارجة ليس لها شكل كتابي موحد. يكتبها الجزائريون بالحرف العربي، بالحروف اللاتينية (المسماة أحياناً “عربيزي” أو فرانكو-عربي)، وكثيراً بمزيج من الاثنين في رسالة واحدة. يمثل الرقم “3” حرف العين، و”7″ يمثل الحاء، و”9″ يمثل القاف. يمكن لكلمة واحدة أن تُكتب بعشرات الطرق.
التحدي الثاني هو التبديل اللغوي. التواصل الرقمي الجزائري يمزج بشكل روتيني بين الدارجة والفرنسية والفصحى — أحياناً في جملة واحدة. تعليق Facebook نموذجي قد يمزج اللغات الثلاث بطرق تتبع قواعد اجتماعية لغوية يفهمها الجزائريون بالفطرة لكن أنظمة معالجة اللغة المدربة على مدونات أحادية اللغة لا تستطيع تحليلها.
ثالثاً، يتضمن مفردات الدارجة كلمات بريئة في الفصحى لكنها مسيئة في السياق الجزائري، والعكس صحيح. السخرية، وهي أسلوب متطور جداً في التواصل الجزائري عبر الإنترنت، تزيد من تعقيد الكشف الآلي.
السبب الجذري لكل هذه التحديات هو البيانات. تدريب مصنفات إشراف محتوى فعالة يتطلب مجموعات بيانات كبيرة مُعلّمة. بالنسبة للإنجليزية، توجد مثل هذه المجموعات بحجم كبير (Jigsaw Toxic Comments وHateXplain وغيرها). بالنسبة للدارجة، بالكاد توجد. لا يوجد مدونة مُعلّمة مكافئة، وإنشاء واحدة يتطلب مُعلقين ناطقين أصليين بالدارجة يفهمون السياق الثقافي — عملية مكلفة وشاقة لم تعطها المنصات الأولوية.
إعلان
ما تفعله Meta والمنصات الأخرى (وما لا تفعله)
يعمل نظام الإشراف على المحتوى في Meta على نموذج متعدد المستويات. المستوى الأول هو مصنفات الذكاء الاصطناعي التي تكشف وتزيل المحتوى المخالف تلقائياً. الثاني هو بلاغات المستخدمين التي يراجعها مشرفون بشريون. الثالث هو الكشف الاستباقي بفرق متخصصة تستهدف أضراراً محددة. بالنسبة للمحتوى الجزائري، مستوى الذكاء الاصطناعي غير فعال إلى حد كبير، مما يدفع العبء نحو المراجعة البشرية.
توظف Meta مشرفي محتوى للمحتوى العربي عبر شركات تعهيد خارجي، أساساً Accenture — التي تتلقى حسب التقارير 500 مليون دولار سنوياً من Facebook لخدمات الإشراف — وMajorel. يتعامل هؤلاء المشرفون مع المحتوى عبر كامل العالم العربي، وبينما بعضهم من شمال أفريقيا، فإن نسبة الحجم إلى المشرفين تعني أن المحتوى الجزائري يتنافس مع محتوى أكثر من 20 دولة عربية على المراجعة البشرية.
استثمرت الشركة في الذكاء الاصطناعي متعدد اللغات — مشروع الترجمة No Language Left Behind (NLLB-200) يغطي 200 لغة بنتائج أفضل بنسبة 44% من النماذج السابقة. لكن الدارجة تبقى غير مخدومة بشكل كافٍ. تُظهر الأبحاث المستقلة حول كشف خطاب الكراهية في اللهجات العربية، بما في ذلك الدارجة المغربية (القريبة لغوياً من الدارجة الجزائرية)، أنه بينما يمكن للنماذج الأكاديمية تحقيق دقة 85-92% على مجموعات اختبار منسقة، فإن الكشف في بيئات الإنتاج الحقيقية مع التبديل اللغوي والإملاء غير المعياري يؤدي أداءً أضعف بكثير.
بحث معالجة اللغة الطبيعية الجزائري والمسار المستقبلي
الخبر الجيد هو أن باحثين جزائريين يعملون بنشاط على معالجة اللغة الطبيعية للدارجة. نشرت مجموعات بحثية في جامعة تلمسان وUSHTB في الجزائر العاصمة وجامعة بجاية أبحاثاً حول تحليل المشاعر بالدارجة والتعرف على الكيانات المسماة وتصنيف النصوص. يمثل مشروع DziriBERT — نموذج لغوي مبني على BERT مُدرب مسبقاً على أكثر من مليون تغريدة بالعربية الجزائرية — خطوة مهمة نحو أدوات معالجة لغة طبيعية خاصة بالدارجة. أنشأ الباحثون أيضاً مجموعات بيانات مُعلّمة صغيرة الحجم لكشف خطاب الكراهية بالدارجة، رغم أنها تبقى أقل بعدة مراتب مما يتطلبه النشر التجاري.
أنتج مجتمع معالجة اللغة العربية مفتوح المصدر أدوات مثل CAMeL Tools من NYU Abu Dhabi (المطور بالتعاون مع Columbia University وCarnegie Mellon University Qatar) وAraGPT2 من الجامعة الأمريكية في بيروت التي تدعم بعض المعالجة للعربية اللهجية، لكن الضبط الدقيق الخاص بالدارجة يبقى محدوداً.
توجد عدة مسارات للأمام. يمكن لـ Meta والمنصات الأخرى الاستثمار في نماذج إشراف خاصة بالدارجة. يمكن للحكومة الجزائرية دعم إنشاء موارد لغوية للدارجة على نطاق واسع كمنافع عامة. يمكن لمنظمات المجتمع المدني توثيق إخفاقات الإشراف بشكل منهجي. ويمكن للباحثين الجزائريين في معالجة اللغة الطبيعية التعاون مع مجموعات دولية تعمل على إشراف اللغات منخفضة الموارد.
الدلالة الأوسع تتجاوز الإشراف على المحتوى. معالجة اللغة الطبيعية للدارجة شرط مسبق لأي تطبيق ذكاء اصطناعي يتفاعل مع المستخدمين الجزائريين بلغتهم الطبيعية — المساعدين الآليين والمساعدين الصوتيين ومحركات البحث وأدوات الترجمة. حل مشكلة الإشراف يعني بناء تقنية لغوية أساسية تفيد منظومة الذكاء الاصطناعي الجزائرية بأكملها.
إعلان
🧭 رادار القرار
| البُعد | التقييم |
|---|---|
| الأهمية بالنسبة للجزائر | عالية جداً — أكثر من 25.6 مليون مستخدم Facebook معرضون لمحتوى ضعيف الإشراف؛ خطاب الكراهية والاحتيال يسببان ضرراً حقيقياً |
| جاهزية البنية التحتية | جزئية — المنصات موجودة وتعمل؛ البنية المفقودة لغوية (مجموعات بيانات مُعلّمة بالدارجة، نماذج معالجة لغة طبيعية) |
| الكفاءات المتاحة | معتدلة — باحثو معالجة اللغة الجزائريون نشطون لكن قليلون؛ يمكن تطوير قوة عاملة من المُعلقين |
| الجدول الزمني | قصير الأجل للمناصرة لدى المنصات (فوري)؛ متوسط الأجل لتطوير نماذج معالجة لغة للدارجة (2-3 سنوات)؛ طويل الأجل لإشراف بمستوى الإنتاج (3-5 سنوات) |
| الأطراف المعنية الرئيسية | Meta، TikTok، YouTube، مجموعات البحث الجزائرية (USTHB، جامعة تلمسان، جامعة بجاية)، وزارة البريد والمواصلات السلكية واللاسلكية، منظمات المجتمع المدني |
| نوع القرار | مناصرة وتقني — يتطلب ضغطاً على المنصات للاستثمار وتطويراً مستقلاً لموارد الدارجة اللغوية |
خلاصة سريعة: يفشل الإشراف على المحتوى بالذكاء الاصطناعي في الجزائر لأن التقنية لم تُبنَ للدارجة. التعقيد اللغوي للتواصل الرقمي الجزائري — التبديل اللغوي والإملاء غير المعياري والدلالات الخاصة بالثقافة — يتطلب استثماراً مخصصاً في الموارد والنماذج اللغوية. الباحثون الجزائريون يبنون الأسس، لكن سد الفجوة يتطلب من شركات المنصات تخصيص موارد تتناسب مع 25.6 مليون مستخدم لديها في البلاد.
المصادر والقراءات الإضافية
- Digital 2025: Algeria — DataReportal
- Meta Transparency Center — Meta
- No Language Left Behind Translation Project — Meta AI
- DziriBERT: Pre-trained Language Model for Algerian Arabic — HuggingFace
- CAMeL Tools for Arabic NLP — NYU Abu Dhabi CAMeL Lab
- Facebook Content Moderation Outsourcing — The Hustle
- Meta Moderation Operations Relocated to Ghana — Foxglove
- Moroccan Darija Toxicity Detection Benchmark — arXiv
- Hate Speech Detection in Arabic Dialects — Frontiers in AI
إعلان