Redressements de la première vague de l’enquête EpiCov : un exemple de correction des effets de sélection dans les enquêtes multimodes
La première vague de l’enquête Épidémiologie et Conditions de vie (EpiCov) a été collectée
en mai 2020 dans le contexte de la pandémie de Covid-19 pour en mesurer l’impact sanitaire
et social. Cette enquête est originale à plusieurs titres : thématique, objectif de
diffusion départementale, mode de collecte essentiellement auto-administrée, réalisation
d’auto-prélèvements. Ce document de travail décrit les redressements réalisés par
l’Insee sur la première vague de l’enquête pour s’assurer de la qualité des résultats.
Ces redressements prennent en compte les spécificités de l’enquête pour corriger le
biais de non-réponse, concernant d’une part le questionnaire et d’autre part les auto-prélèvements.
Cependant, ces méthodes de correction usuelles ne s’avèrent pas suffisantes pour corriger
certaines variables d’intérêt de l’enquête comme les symptômes déclarés dans l’enquête
qui ont affecté les répondants. En théorie, le biais observé sur ces variables peut
s’expliquer par une erreur de mesure, liée à l’utilisation de plusieurs modes de collecte,
ou par l’existence d’une sélection liée, de manière résiduelle, aux variables d’intérêt,
non corrigée par les méthodes de correction de la non-réponse sur variables observables.
On montre dans ce document que le biais procède d’une sélection liée aux variables
d’intérêt et non d'une erreur de mesure associée au mode. Une méthode de correction
de la sélection liée aux variables d’intérêt, basée sur un modèle de sélection d’Heckman,
est mise en œuvre pour estimer sans biais les valeurs moyennes des variables d’intérêt
concernées. Pour les variables de symptômes, la correction peut représenter plus de
50 % du niveau de prévalence déclaré non-corrigé. Cette correction conduit à réduire
le niveau de prévalence des symptômes, conformément à l’idée selon laquelle les répondants
à l’enquête semblent, en moyenne, davantage affectés par les symptômes de la maladie
que les non-répondants.