Un barrage qui alimente un million de personnes, surveillé un échantillon de laboratoire à la fois
Le barrage de la Cheffia, dans la wilaya d’El Tarf, n’est pas un réservoir mineur. Construit en 1965 avec un volume régularisable d’environ 95 millions de mètres cubes, il fournit l’eau potable à la région d’Annaba — une population proche d’un million d’habitants — ainsi que l’irrigation des périmètres de Bounamoussa et l’eau de process du complexe sidérurgique d’El-Hadjar. Sa qualité s’est dégradée ces dernières années sous l’effet du ruissellement des engrais agricoles et des rejets industriels, ce qui fait d’une surveillance régulière une nécessité de santé publique, et non un luxe de recherche.
Cette surveillance coûte cher. Déterminer si l’eau du barrage est sûre suppose de mesurer une longue liste de paramètres physiques, chimiques et biologiques en laboratoire, puis de les condenser en un indice unique de qualité de l’eau (IQE) — une note de 0 à 100 qui indique aux exploitants, d’un coup d’œil, à quel point l’eau est propre. Chaque paramètre exige des réactifs, des instruments, du temps de technicien et le transport d’échantillons. Des études internationales sur les coûts ont établi que le transport des échantillons et la main-d’œuvre représentent à eux seuls environ 75 % du coût marginal de la surveillance de la qualité de l’eau potable dans les pays en développement. Réduire le nombre de paramètres à mesurer, c’est réduire l’essentiel de la facture.
C’est précisément ce qu’une nouvelle étude a entrepris de tester — et le résultat constitue l’un des exemples les plus concrets à ce jour d’un apprentissage automatique offrant un levier de coût à un service public algérien.
Ce que l’étude algérienne a réellement démontré
Cette recherche, publiée le 15 mai 2026 dans Frontiers in Earth Science, a été menée par Fahim Bordjihene, avec les co-auteurs Salah Eddine Tachi, Hamza Bouguerra et Jazia Arrar. Il s’agit d’un travail conjoint entre le Laboratoire de recherche des sciences de l’eau de l’École Nationale Polytechnique d’Alger et le Laboratoire des ressources en eau et développement durable de l’Université Badji Mokhtar-Annaba, l’une des plus grandes institutions de recherche d’Algérie avec ses 89 laboratoires.
L’équipe a entraîné et comparé huit algorithmes d’apprentissage automatique — XGBoost, AdaBoost, CatBoost, Decision Tree, Random Forest, régression linéaire multiple, Support Vector Machine et un ensemble Stacking Voting — sur les données de la Cheffia, en testant différentes combinaisons de paramètres d’entrée pour voir avec combien de mesures, au minimum, on pouvait reproduire l’IQE complet. Le grand gagnant a été XGBoost, un modèle de gradient boosting largement utilisé pour les tâches de prédiction sur données structurées, qui a atteint un R²=0,987 avec un RMSE=0,0181 et un MAE=0,0111.
Le détail crucial réside dans quelles entrées ont permis ce score. La meilleure combinaison n’utilisait que trois paramètres : nitrite (NO₂), phosphate (PO₄) et ammonium (NH₄). Autrement dit, le modèle reconstitue un indice de qualité multi-paramètres complet à partir de trois mesures de nutriments qui se trouvent être les empreintes chimiques exactes de la pollution par engrais et effluents à laquelle la Cheffia est confrontée. La formulation de l’étude est explicite : l’approche « réduit le nombre d’analyses requises en laboratoire, diminuant ainsi les coûts de surveillance ».
Une précision utile pour les lecteurs non spécialistes : R²=0,987 mesure à quel point les prédictions du modèle suivent fidèlement l’indice réel — ce n’est pas un chiffre littéral signifiant que « 98,7 % des échantillons sont sûrs ». Cela veut dire que le modèle explique 98,7 % de la variation de l’indice. Pour un outil de surveillance opérationnel, c’est la métrique qui compte.
Publicité
Pourquoi cela compte pour les autorités algériennes de l’eau
L’Algérie exploite des dizaines de barrages soumis à un stress hydrique chronique, et ceux qui les gèrent affrontent partout la même équation : davantage de points et de fréquence de prélèvement améliorent la sécurité, mais l’un comme l’autre coûtent un argent dont le secteur ne dispose pas en surplus. Un modèle qui déduit le tableau complet de qualité à partir de trois mesures de nutriments bon marché modifie ce compromis. Le même budget pourrait couvrir davantage de sites de prélèvement, ou des contrôles plus fréquents aux mêmes endroits, ou libérer du temps de technicien pour les paramètres qui ne peuvent vraiment pas être déduits.
C’est aussi un cas rare où le sujet de la recherche et le bénéficiaire sont le même pays. Le jeu de données est algérien, le barrage est algérien, les sources de pollution sont algériennes et les institutions sont algériennes. Un modèle d’IQE entraîné sur la Cheffia ne se transposera pas parfaitement à un barrage au profil de pollution différent — mais la méthode est transférable, et les deux laboratoires qui l’ont conçue sont nationaux. Cela compte pour les travaux sur la qualité de l’eau dans le Nord-Est algérien, où des études similaires combinant IQE et ACP cartographient déjà les réservoirs de la région.
Ce que les autorités algériennes de l’eau devraient faire
1. Tester le modèle à trois paramètres sur un seul barrage avant de le généraliser, et non après
Choisissez un seul réservoir au profil de pollution connu — idéalement un site où le ruissellement de nutriments domine, comme la Cheffia — et faites tourner l’approche XGBoost en parallèle d’analyses de laboratoire complètes pendant une année hydrologique entière. L’objectif est de mesurer là où les prédictions du modèle s’écartent de la vérité de laboratoire au fil des saisons, y compris lors des crues où les concentrations grimpent. Ne déployez pas la méthode à l’échelle du réseau sur la seule foi d’un score R² publié ; un modèle qui explique 98,7 % de la variance peut tout de même manquer les 1,3 % qui incluent un épisode de contamination. Validez d’abord, puis décidez quelles campagnes de routine peuvent passer sans risque à trois paramètres.
2. Adapter les paramètres d’entrée aux sources réelles de pollution de chaque barrage
Le modèle de la Cheffia fonctionne parce que le nitrite, le phosphate et l’ammonium sont les signatures chimiques des engrais et des effluents — les menaces dominantes pour ce réservoir précis. Un barrage alimenté par un bassin versant marqué par des rejets miniers de métaux lourds ou une intrusion saline nécessite un autre jeu d’entrées, car les trois nutriments ne captureront pas ces risques. Avant d’adopter la méthode ailleurs, commandez une courte étude de sélection de variables par barrage afin d’identifier quels deux à quatre paramètres reconstituent le mieux l’indice de ce réservoir. Traitez le résultat à trois paramètres comme un modèle de la méthode, et non comme une recette universelle.
3. Conserver la capacité de laboratoire pour l’étalonnage et les exceptions, ne jamais l’éliminer
Le but est de réduire les analyses de routine, pas de démanteler le laboratoire. Les modèles dérivent à mesure que les profils de pollution changent — un nouveau rejet industriel, une évolution des pratiques agricoles ou un pic de concentration lié à la sécheresse peuvent tous rompre la relation apprise par le modèle. Conservez une capacité de laboratoire suffisante pour ré-étalonner le modèle selon un calendrier fixe (au minimum trimestriel) et pour effectuer une confirmation sur panel complet chaque fois que le modèle signale un indice limite ou en baisse. Le laboratoire passe de la réalisation de tous les tests à celle des tests qui enseignent au modèle et le contrôlent.
4. Développer les compétences en interne en s’appuyant sur la base de recherche nationale
Ce travail a été réalisé par des laboratoires universitaires algériens, ce qui signifie que l’expertise pour l’opérationnaliser existe à l’intérieur du pays. Les autorités de l’eau devraient détacher du personnel technique vers de courtes collaborations avec les équipes de l’École Nationale Polytechnique et de l’Université Badji Mokhtar-Annaba, plutôt que d’acheter un produit « boîte noire » auprès d’un fournisseur externe. Le même principe vaut pour le domaine plus large de l’apprentissage automatique appliqué à la surveillance de l’eau, qui évolue rapidement à l’échelle mondiale — posséder le modèle et le code, plutôt que de les louer, est ce qui rend l’économie durable et les données souveraines.
Où cela s’inscrit dans la stratégie de l’eau de l’Algérie en 2026
Le secteur de l’eau algérien absorbe déjà l’IA à plusieurs niveaux — irrigation de précision, détection de fuites et optimisation du dessalement, entre autres. La surveillance de la qualité est une application plus discrète mais sans doute à plus fort effet de levier, car elle se situe à l’intersection de la santé publique et des budgets serrés. L’étude de la Cheffia ne promet pas une révolution ; elle démontre une efficacité précise et mesurable sur un réservoir, construite par deux laboratoires nationaux, à l’aide d’un modèle que chacun peut auditer.
La formulation honnête est qu’il s’agit d’une preuve de concept avec une voie claire vers la valeur, et non d’un système déployé. Sa force est exactement ce qui le rend crédible : une affirmation circonscrite, un jeu de données public, une méthode reproductible et un résultat qui pointe vers un poste de coût — les analyses de laboratoire — qui domine réellement les budgets de surveillance. Si les autorités algériennes de l’eau le traitent comme un modèle à valider barrage par barrage plutôt que comme un interrupteur à actionner à l’échelle nationale, il devient l’une des opportunités d’IA les plus ancrées dans la boîte à outils environnementale du pays. La prochaine étape est un projet pilote financé, pas un nouvel article.
Questions Fréquemment Posées
Quelle est la précision du modèle XGBoost pour prédire la qualité de l’eau du barrage de la Cheffia ?
Le modèle XGBoost a atteint un R²=0,987 avec un RMSE de 0,0181 et un MAE de 0,0111, le meilleur des huit algorithmes testés par les chercheurs. R²=0,987 signifie que le modèle explique 98,7 % de la variation de l’indice de qualité de l’eau — c’est une mesure d’ajustement prédictif, et non une part littérale d’échantillons sûrs. Pour une surveillance opérationnelle de routine, ce niveau d’ajustement est solide.
Quels paramètres de l’eau le modèle a-t-il besoin pour prédire l’indice de qualité ?
La meilleure combinaison n’utilisait que trois paramètres chimiques : nitrite (NO₂), phosphate (PO₄) et ammonium (NH₄). Ces trois éléments sont les signatures chimiques du ruissellement d’engrais agricoles et des effluents — les sources de pollution dominantes à la Cheffia. Parce que le modèle reconstitue l’indice complet à partir de ces trois mesures, il peut réduire le nombre d’analyses de laboratoire nécessaires aux contrôles de routine.
Cette approche peut-elle être utilisée sur d’autres barrages algériens ?
La méthode est transférable, mais la recette précise à trois paramètres n’est pas universelle. Un modèle entraîné sur la Cheffia est calibré pour la pollution azotée de ce réservoir ; un barrage confronté à une contamination par métaux lourds ou à une salinité nécessiterait un autre jeu d’entrées. Les autorités de l’eau devraient mener une courte étude de sélection de variables par barrage et valider face à des analyses de laboratoire complètes avant de l’adopter ailleurs.
Sources et lectures complémentaires
- complémentaires
- Approches d’apprentissage automatique pour prédire l’indice de qualité de l’eau du barrage de la Cheffia — Frontiers in Earth Science
- Université Badji Mokhtar-Annaba — Wikipedia
- Évaluation de la qualité de l’eau dans le Nord-Est algérien via IQE et ACP — Water Practice & Technology, IWA Publishing
- Comparaison et analyse des coûts de surveillance de la qualité de l’eau potable dans sept pays en développement — PMC
- Apprentissage automatique pour la prédiction de la qualité de l’eau avec des paramètres réduits — Scientific Reports
- Une revue de l’apprentissage automatique et de l’IoT sur l’évaluation de la qualité de l’eau — ScienceDirect




