Atelier Mapme : Evaluation d’impact sur données spatiales
October 1, 2024
Le problème principal soulevé par le modèle de Rubin lors de l’évaluation des effets d’une intervention est l’impossibilité d’observer :
\[\mathbb{E}(Y_{0i} \mid T_i = 1)\]
Question clé : Quel aurait été le résultat observé sur les unités traitées en l’absence du traitement ?
Enjeu : Trouver un contrefactuel valide / pertinent.
Menaces :
Une solution : Les essais randomisés contrôlés (ERC)
Randomisation : Le fait de participer au projet ou non est défini de façon aléatoire (exemple = à l’aide d’une loterie).
Si on tire au sort un grand nombre d’individus, la distribution dans l’échantillon est très proche de celle de la population totale :
Si maintenant on tire au sort un échantillon beaucoup plus petit, il y a de fortes chances pour que nos distributions diffèrent fortement de celle de la population totale.
Plus la taille de l’échantillon grandit, plus la distribution ressemble à celle de la population totale et la moyenne ou la médiane des groupes de traitement et de contrôle se rapprochent (avec une dimension aléatoire toutefois).
A partir de 1000 unités, on commence à avoir une relative similitude.
En s’appuyant sur le tirage aléatoire de deux sous-échantillons de la population cible, nous devrions observer une distribution similaire des caractéristiques observables et inobservables :
\[ E(X \mid T = 1) = E(X \mid T = 0) = E(X) \]
De même, en l’absence du programme, la distribution des variables de résultats devrait être identique (absence de biais de sélection).
Ainsi, le groupe de contrôle devient un contrefactuel pertinent. L’hypothèse suivante devient beaucoup plus réaliste :
\[ E(Y_0 \mid T = 0) = E(Y_0 \mid T = 1) = E(Y_0) \]
Attention ! L’hypothèse faite sur la validité du contrefactuel n’est valable qu’en moyenne (impossible de dire que (X_i(1) = X_i(0)) et que (Y_i(1) = Y_i(0))).
Nous pouvons uniquement essayer de mesurer l’effet moyen du programme qui est obtenu par :
\[ E(Y_i \mid T_i = 1) - E(Y_i \mid T_i = 0) \]
Différence de moyennes : \[ E(Y_{1i} \mid T_i = 1) - E(Y_{0i} \mid T_i = 0) \longrightarrow \overline{Y}_1 - \overline{Y}_0 \]
Régression linéaire : \[ Y_i = \alpha + \beta T_i + \epsilon_i \] avec :
Dans les faits, les unités sont souvent imbriquées :
Le niveau du tirage dépend de celui de l’intervention : le niveau de randomisation ne peut être inférieur au niveau auquel est assigné le programme.
La randomisation n’est pas la panacée : sa pertinence dépend du type d’intervention ⟶ arbitrages :
Un niveau trop agrégé de l’assignation (régions, pays, provinces) diminue la puissance statistique et augmente le risque de facteurs confondants.
Assigner une intervention à un niveau très désagrégé (individu, ménage) augmente les risques de contamination du groupe de contrôle.
Validité interne : La différence observée sur les variables de résultats entre traités et non-traités est attribuable à l’intervention et à l’intervention seulement.
Validité interne : assignation aléatoire du traitement
Le groupe de contrôle est similaire au groupe de traitement (en moyenne) avant l’intervention.
Une fois l’intervention commencée, les deux groupes sont exposés au même environnement et aux mêmes évolutions temporelles.
Groupe de contrôle : bonne représentation de ce qu’il serait arrivé aux “traités” en l’absence de traitement.
La différence de résultats entre traités et non-traités après l’intervention est donc due à cette dernière.
Validité externe : Les résultats de l’évaluation sont généralisables à l’ensemble des unités éligibles (dans le temps, dans d’autres contextes).
Enjeux éthiques : les gens ne sont pas des hamsters
Enjeux statistiques : être sûr de pouvoir détecter un effet
Contamination et externalités : menaces sur la validité interne
Comment randomiser?
Quel est le processus à suivre pour “randomiser” un projet/programme/intervention? Plusieurs étapes :
Identification des unités éligibles au programme (individus, ménages, écoles, villages, aires géographiques) : les unités pour lesquelles nous voulons connaître l’impact du programme.
Sélection de l’échantillon soumis à l’évaluation (extraction de la population d’intérêt).
Assignation aléatoire du traitement (quel groupe bénéficie de l’intervention?).