Flux de travail pour l'évaluation de la qualité des données SIGS

Évaluation systématique de la qualité des données de santé mensuelles au niveau des établissements

ENTRÉE : Données mensuelles des établissements

facility_id, period_id, indicator, count

Données brutes de rapports des établissements de santé agrégées au niveau mensuel pour tous les indicateurs

1

Chargement et préparation des données

  • Charger les données SIGS brutes à partir du fichier CSV
  • Convertir period_id en format date pour l'ordonnancement des séries temporelles
  • Détecter les colonnes de zones administratives disponibles dans le jeu de données
2

Détection des valeurs aberrantes

  • Calculer la médiane et le MAD pour chaque combinaison établissement-indicateur
  • Signaler les valeurs aberrantes basées sur le MAD : valeurs >10× MAD de la médiane
  • Signaler les valeurs aberrantes proportionnelles : un seul mois >80% du volume annuel
  • Signalement final : (valeur aberrante MAD OU valeur aberrante proportionnelle) ET count >100
3

Évaluation de l'exhaustivité

  • Générer une série temporelle mensuelle complète pour chaque établissement-indicateur
  • Signaler les mois avec des rapports manquants comme incomplets (flag=0)
  • Signaler les périodes inactives : 6+ mois manquants avant le premier ou après le dernier rapport
  • Exclure les périodes inactives de l'analyse (flag=2)
4

Analyse de la cohérence

  • Agréger au niveau du district (prend en compte les mouvements de patients)
  • Calculer les ratios des paires d'indicateurs : Penta1/Penta3 ≥0,95, ANC1/ANC4 ≥0,95
  • Appliquer la référence BCG/Accouchement : ratio entre 0,7-1,3
  • Étendre les résultats de cohérence du district à tous les établissements de cette zone
5

Notation DQA

  • Filtrer sur les indicateurs DQA principaux
  • Vérifier : complet, sans valeurs aberrantes, cohérent
  • Score DQA = 1 si toutes les vérifications réussissent
  • Score DQA = 0 si une vérification échoue

SORTIES

M1_output_outlier_list.csv (valeurs aberrantes signalées uniquement)
M1_output_outliers.csv (tous les enregistrements avec signalements)
M1_output_completeness.csv (statut d'exhaustivité)
M1_output_consistency_geo.csv (niveau district)
M1_output_consistency_facility.csv (niveau établissement)
M1_output_dqa.csv (scores DQA finaux)