• English
  • Français
  1. 2. Assemblage et gestion des données
  2. 2.1 Utilisation des shapefiles
  3. Aperçu des données spatiales
  • Bibliothèque de code pour l'adaptation infranationale
    Version française
  • 1. Pour commencer
    • 1.1 À propos et comment nous contacter
    • 1.2 Pour tous les utilisateurs
    • 1.3 Pour l’équipe SNT
    • 1.4 Pour les analystes
    • 1.5 Acronymes et bibliothèque de ressources
  • 2. Assemblage et gestion des données
    • 2.1 Utilisation des shapefiles
      • Aperçu des données spatiales
      • Utilisation et visualisation de base des shapefiles
      • Gestion et personnalisation des shapefiles
      • Fusion des shapefiles avec des données tabulaires
    • 2.2 Formations sanitaires
      • Health facility active/inactive status
      • Health facility coordinates
      • Master facility lists
    • 2.3 Données de routine (DHIS2)
      • Health facility reporting rate
      • Outlier detection methods
      • Imputation of missing data
      • Final database
      • Data extraction from DHIS2
      • Import dataset
      • Outlier correction
      • Quality control/checks
    • 2.4 Données de stock
    • 2.5 Données démographiques
      • Données démographiques nationales
      • Raster de population WorldPop
    • 2.6 Enquêtes nationales auprès des ménages
      • DHS Data Overview and Preparation
      • All-Cause Child Mortality
      • Extraction of ITN ownership, access, and usage
      • Extracion of prevalence data
      • Calculation of treatment-seeking data
    • 2.7 Données entomologiques
    • 2.8 Données climatiques et environnementales
      • Extraction de données climatiques et environnementales à partir de données raster
    • 2.9 Données modélisées
      • Generating spatial modeled estimates
      • Travailler avec les estimations modélisées géospatiales
      • Modeled Estimates of Entomological Indicators
      • Mortality estimates from IHME
    • 2.10 Données financières
  • 3. Analyse de la situation
    • 3.1 Revue des interventions historiques
      • Prise en charge des cas
      • Interventions de routine
      • Les campagnes de masse de moustiquaires
      • Les campagnes de chimioprévention
      • Autres interventions lutte antivectorielle
    • 3.2 Analyse des tendances
    • 3.3 Analyse des facteurs de risque
    • 3.4 Évaluation de l’impact des interventions
    • 3.5 Analyse des coûts
  • 4. Stratification
    • 4.1 Stratification épidémiologique
    • 4.2 Accès aux soins
    • 4.3 Saisonnalité
    • 4.4 Microstratification urbaine
  • 5. Ciblage et priorisation des interventions
    • 5.1 Ciblage des interventions
    • 5.2 Priorisation
    • 5.3 Optimisation dans la limite des ressources

On this page

  • Vue d’ensemble
  • Données spatiales dans la bibliothèque de code SNT
  • Travailler avec les shapefiles
    • Formats de vecteurs spatiaux dans les flux de travail SNT
    • Qu’est-ce qu’un shapefile ?
    • Choix et provenance des shapefiles pour la SNT
    • Systèmes de référence de coordonnées (CRS)
  • Ressources supplémentaires sur les vecteurs spatiaux et les formats vectoriels SIG
  • Résumé
  1. 2. Assemblage et gestion des données
  2. 2.1 Utilisation des shapefiles
  3. Aperçu des données spatiales

Aperçu des données spatiales

Débutant

Vue d’ensemble

Les données spatiales sont au cœur du processus SNT. Elles permettent à l’équipe SNT de quantifier la charge du paludisme, d’évaluer la couverture des interventions et de cibler les stratégies sur des zones géographiques spécifiques. Chaque étape de l’analyse repose sur des unités spatiales alignées avec les besoins opérationnels de la prise de décision, telles que les districts, les chefferies ou les zones définies par le programme.

Les flux de travail SNT s’appuient sur deux principaux types de données spatiales : vecteur et raster. Les données vectorielles capturent des entités géographiques discrètes telles que les limites administratives, les routes et les emplacements des formations sanitaires (les données ponctuelles peuvent également être représentées sous forme de tableau avec des métadonnées associées), tandis que les données raster représentent des surfaces continues telles que les précipitations, la température ou la densité de population. Bien que le terme « vecteur spatial » soit techniquement correct pour désigner les données géographiques vectorielles, cette documentation utilise « shapefile » tout au long du texte car il s’agit du terme couramment connu et largement utilisé dans les contextes de santé publique et les programmes de lutte contre le paludisme. Cette distinction entre la terminologie formelle et l’usage pratique est importante à comprendre. Des définitions plus détaillées des types et formats de données spatiales sont abordées dans les sections suivantes.

NoteObjectifs
  • Comprendre le rôle des données shapefile dans les flux de travail SNT
  • Comprendre l’importance de shapefiles correctement sourcés pour la SNT
  • Comprendre les formats de données spatiales et l’importance des systèmes de référence de coordonnées

Données spatiales dans la bibliothèque de code SNT

La bibliothèque de code contient de nombreuses pages dédiées à la démonstration du travail avec des données spatiales. Pour travailler avec des shapefiles, voir :

  • Utilisation et visualisation de base des shapefiles - Bases du chargement et de la visualisation des shapefiles et des données d’attributs associées
  • Coordonnées des formations sanitaires et données ponctuelles - Chargement de données ponctuelles à partir d’un tableau et visualisation des données ponctuelles, avec l’exemple de la cartographie des coordonnées des formations sanitaires
  • Gestion et personnalisation des shapefiles - Validation et dépannage des shapefiles, et création de shapefiles personnalisés
  • Fusion de shapefiles avec des données tabulaires - Combinaison de shapefiles avec des données géographiques provenant d’autres parties du processus SNT pour préparer la visualisation

Les flux de travail SNT s’appuient également sur des données raster et des estimations de modèles géospatiaux disponibles sous forme de sorties au format raster. Pour des informations sur le travail avec des données raster, voir les pages ci-dessous :

  • Travailler avec les estimations modélisées géospatiales - Guide général sur la manière d’extraire, de visualiser et d’agréger des données raster vers des unités administratives pour l’analyse SNT, avec l’exemple de la prévalence de l’infection palustre
  • Rasters de population WorldPop - Téléchargement, extraction, visualisation et agrégation des estimations de population de WorldPop
  • Extraction de données climatiques et environnementales à partir de rasters - Téléchargement, extraction, visualisation et agrégation de données climatiques et environnementales
  • Estimations modélisées de la mortalité palustre et de ses indicateurs indirects - Téléchargement, extraction, visualisation et agrégation des estimations de mortalité infantile toutes causes confondues
  • Estimations modélisées des indicateurs entomologiques - Téléchargement, extraction, visualisation et agrégation des estimations modélisées d’indicateurs entomologiques tels que l’abondance relative des espèces vectrices et la résistance aux insecticides

Travailler avec les shapefiles

Les shapefiles sont l’une des deux principales façons de représenter des données géospatiales, aux côtés des données raster. Les shapefiles capturent des entités du monde réel, telles que des points, des lignes et des polygones, ainsi que les attributs associés. Ils constituent la base de la plupart des applications de système d’information géographique (SIG) utilisées dans les flux de travail SNT.

Bien que le terme shapefile soit couramment utilisé dans les contextes de santé publique et les programmes de lutte contre le paludisme pour désigner les données de limites géographiques, il s’agit techniquement d’un format de fichier spécifique pour le stockage de données vectorielles spatiales, développé par Esri dans les années 1990. Il reste largement utilisé dans les SIG de santé publique, y compris dans de nombreux programmes nationaux de lutte contre le paludisme. Cependant, les données vectorielles spatiales peuvent également être stockées dans d’autres formats tels que GeoJSON, GeoPackage et File Geodatabase.

Formats de vecteurs spatiaux dans les flux de travail SNT

Les formats de vecteurs spatiaux suivants sont couramment utilisés dans la SNT et les contextes de santé publique :

  • Shapefile (.shp + fichiers associés) – un format hérité mais largement pris en charge, composé de plusieurs fichiers liés. Courant dans les flux de travail de santé publique et SIG en général malgré ses limites (par exemple, noms de champs courts, encodage de caractères limité).

  • GeoJSON – un format léger et lisible par l’humain basé sur JSON. Courant dans la cartographie web et facilement pris en charge dans R, Python et les outils SIG.

  • GeoPackage (.gpkg) – un format ouvert à fichier unique pouvant stocker plusieurs couches vectorielles (et raster) avec des métadonnées. Pris en charge sur plusieurs plateformes, notamment R, Python, QGIS et ArcGIS.

  • File Geodatabase (.gdb) – format propriétaire d’Esri pour gérer plusieurs couches dans un dossier structuré. Principalement utilisé dans ArcGIS mais accessible dans R et Python.

Bien que les différents formats de vecteurs spatiaux, tels que Shapefile, GeoJSON ou File Geodatabase, puissent varier dans leur mode de stockage et de sauvegarde, une fois importés dans R ou Python, ils sont tous représentés sous forme d’objets spatiaux standard. En pratique, cela signifie que la méthode d’importation a plus d’importance que le format de fichier d’origine pour la manière dont les données sont traitées dans l’analyse.

Qu’est-ce qu’un shapefile ?

Dans la bibliothèque de code, nous utilisons principalement des données de la Sierra Leone fournies au format shapefile Esri (.shp). Le shapefile Esri reste l’un des formats les plus fréquemment utilisés dans de nombreux programmes nationaux de lutte contre le paludisme et les flux de travail SNT existants. Cependant, nous démontrons également comment importer des vecteurs spatiaux stockés dans d’autres formats, tels que GeoJSON, GeoPackage et File Geodatabase, afin de tenir compte des différentes préférences de format et des normes institutionnelles dans les flux de travail SNT.

Contrairement à d’autres vecteurs spatiaux, le shapefile Esri (.shp) comporte certaines particularités structurelles. Bien qu’il soit couramment appelé « shapefile », il ne s’agit pas d’un fichier unique mais d’un ensemble de plusieurs fichiers qui fonctionnent ensemble pour stocker à la fois la géométrie et les informations d’attributs des entités spatiales.

Pour la plupart des applications SNT, les trois composants les plus essentiels sont :

  • .shp – contient la géométrie des entités spatiales
  • .shx – un fichier d’index reliant la géométrie aux enregistrements d’attributs
  • .dbf – stocke les attributs de chaque entité (au format dBASE)

Ces fichiers doivent être conservés ensemble et alignés par position d’enregistrement. Bien que des fichiers supplémentaires comme .prj (projection) ou .cpg (encodage des caractères) soient souvent inclus, ils ne sont pas strictement nécessaires pour les fonctionnalités de base.

Choix et provenance des shapefiles pour la SNT

Avant le début de toute analyse, l’une des premières tâches de l’équipe SNT est de confirmer la plus petite unité administrative opérationnelle où les décisions programmatiques et les interventions peuvent réalistement être prises. Ce choix, qu’il s’agisse d’adm1, d’adm2 ou d’une unité personnalisée, définit l’unité d’analyse pour l’ensemble de l’exercice. Il détermine également quelle couche de limites (shapefile) doit être utilisée. Les analystes doivent toujours confirmer que cette décision a été prise avant de commencer tout travail spatial, ou amorcer la discussion si elle n’a pas encore eu lieu.

ImportantConsulter l’équipe SNT

Tous les shapefiles utilisés dans la SNT doivent être examinés et validés par l’équipe SNT et doivent représenter l’ensemble officiel des limites nationales. Cela garantit l’alignement avec les normes nationales, la précision des limites et évite les divergences dans les données spatiales.

Seules les données de limites (shapefiles) officiellement fournies par l’équipe SNT doivent être utilisées pour les analyses SNT. Les données de limites disponibles publiquement (telles que celles de HDX ou GADM) peuvent être utiles pour l’apprentissage ou l’exploration, mais elles ne doivent pas être utilisées dans les flux de travail SNT à moins d’avoir été examinées et explicitement approuvées par l’équipe SNT. Si aucun fichier de limites officiel n’est disponible, l’équipe SNT peut décider de se procurer les données auprès d’un jeu de données public fiable, mais cette décision doit être prise de manière centralisée.

TipAssurez-vous de disposer de tous les shapefiles nécessaires

Demandez toujours tous les niveaux administratifs pertinents, et pas seulement l’unité d’analyse choisie. Par exemple, si l’analyse est menée au niveau adm2, vous devriez également obtenir le shapefile adm1 correspondant. Cela permet aux cartes produites d’inclure les limites de niveau supérieur pour une orientation et une interprétation claires.

Si vous ne disposez que des unités de niveau inférieur (par exemple, adm3) et qu’il vous manque les niveaux supérieurs, il existe des moyens de les dériver à partir des unités inférieures. Ces étapes sont abordées plus loin dans le guide. Utilisez cette approche avec prudence et validez toujours les résultats par rapport à une source fiable et reconnue.

Pour les besoins de la SNT, les shapefiles officiels de l’équipe SNT doivent être utilisés plutôt qu’un jeu accessible publiquement. Cependant, les shapefiles disponibles publiquement peuvent rester très utiles pour d’autres analyses. Les sources d’accès général aux shapefiles incluent :

  • GADM : Limites administratives mondiales
  • Humanitarian Data Exchange (HDX) : Jeux de données humanitaires et de limites administratives
ImportantIdentifier la clé unique

Lorsque vous recevez un shapefile officiel, l’une de vos premières tâches consiste à identifier la colonne d’identifiant unique (par exemple, adm3 ou FIRST_CHIE). Ce code ou ce nom sera utilisé pour joindre les données spatiales à toutes vos données tabulaires (par exemple, MFL, données de routine, etc.). Confirmez avec l’équipe SNT que cet identifiant est cohérent dans tous vos jeux de données.

Systèmes de référence de coordonnées (CRS)

Un système de référence de coordonnées (CRS) est un cadre basé sur des coordonnées utilisé pour localiser des entités à la surface de la Terre. Il se compose de plusieurs éléments :

  • Système de coordonnées – Définit la manière dont les positions sont décrites (par exemple, latitude/longitude, UTM).
  • Unités – Spécifie les unités de mesure (par exemple, degrés décimaux, mètres).
  • Datum – Le modèle de la Terre utilisé comme référence (par exemple, WGS84, NAD83). Toutes les couches spatiales doivent utiliser le même datum pour s’aligner correctement.
  • Projection – La transformation mathématique utilisée pour représenter la Terre courbe sur une surface plane. Cela influence la manière dont les distances, les surfaces et les formes sont calculées.

Différents CRS servent à différentes fins :

  • WGS84 (EPSG:4326) est un CRS global qui utilise la latitude et la longitude sur un modèle terrestre sphérique. Il est idéal pour la cartographie globale et la collecte de données par GPS, mais moins adapté aux mesures précises de distance ou de surface. Pour la cartographie standard à des fins de visualisation dans la SNT, WGS84 est généralement utilisé.
  • Zones UTM (EPSG:326XX) supposent une Terre plate dans de petites régions. Elles utilisent les mètres comme unité et conviennent mieux pour mesurer les distances ou les surfaces au niveau national ou infranational.
  • Projections à surface équivalente (par exemple, EPSG:6933) préservent les relations de surface et sont utiles lors de la comparaison de la couverture terrestre ou de la réalisation de statistiques zonales.

Lors du calcul de distances ou de surfaces, utilisez un CRS projeté qui respecte la courbure de la Terre et qui dispose d’unités linéaires appropriées (par exemple, mètres). Par exemple, si vous devez calculer la zone de service couverte par une formation sanitaire, mesurer la distance jusqu’à la formation sanitaire la plus proche ou créer des zones tampons, l’UTM serait un meilleur choix que WGS84.

Ressources supplémentaires sur les vecteurs spatiaux et les formats vectoriels SIG

Si vous découvrez les shapefiles ou souhaitez approfondir votre compréhension de la manière dont les données shapefile sont stockées et gérées dans les SIG, les ressources suivantes fournissent des conseils clairs et fiables :

Pour les utilisateurs de R

  • 📘 Applied Spatial Data Analysis in R (ASDAR) – Un manuel fondateur pour l’analyse de données spatiales avec R, couvrant la théorie et les applications pratiques.

  • 🧑‍🏫 Introduction to Geospatial Data in R (Data Carpentry) – Une série d’ateliers adaptée aux débutants couvrant l’importation, la visualisation et la manipulation de shapefiles dans R.

  • 🧰 Simple Features for R (sf) – R Package – Documentation officielle du package sf, la référence pour la gestion des données vectorielles dans R.

Pour les utilisateurs de Python

  • 🎓 Python Foundation for Spatial Analysis (Spatial Thoughts) – Un cours complet offrant une introduction progressive à la programmation Python axée sur les flux de travail de données géospatiales.

  • 🧭 Introduction to Python for Geographic Data Analysis – Un guide en accès libre, bien structuré, pour travailler avec des données spatiales en Python à l’aide de bibliothèques clés telles que geopandas.

  • 💡 Geopandas Documentation – Le site officiel de geopandas, le package Python le plus utilisé pour le travail avec des données vectorielles.

Ces ressources fournissent à la fois des bases conceptuelles et des conseils pratiques, que vous travailliez avec R, Python ou tout autre environnement SIG.

Résumé

Cette section présente les connaissances de base nécessaires pour travailler avec les données spatiales dans l’analyse SNT. Elle introduit les concepts fondamentaux et les formats de vecteurs spatiaux, en mettant l’accent sur les shapefiles, et explique en particulier l’importance d’une provenance appropriée des shapefiles. Des références sont fournies vers d’autres contenus de la bibliothèque de code sur le travail avec les données spatiales, ainsi que vers d’autres ressources d’apprentissage.

 

©2026 Applied Health Analytics for Delivery and Innovation. All rights reserved