Redressements de la première vague de l’enquête EpiCov : un exemple de correction des effets de sélection dans les enquêtes multimodes

Laura Castell, Cyril Favre-Martinoz, Nicolas Paliod, Patrick Sillard (Insee)

Documents de travail

N^o M2023/02

Paru le :Paru le07/04/2023

Découvrir la collection

Version imprimable

(pdf, 1 Mo)

Laura Castell, Cyril Favre-Martinoz, Nicolas Paliod, Patrick Sillard (Insee)

Documents de travail N^o M2023/02- Avril 2023

La première vague de l’enquête Épidémiologie et Conditions de vie (EpiCov) a été collectée en mai 2020 dans le contexte de la pandémie de Covid-19 pour en mesurer l’impact sanitaire et social. Cette enquête est originale à plusieurs titres : thématique, objectif de diffusion départementale, mode de collecte essentiellement auto-administrée, réalisation d’auto-prélèvements. Ce document de travail décrit les redressements réalisés par l’Insee sur la première vague de l’enquête pour s’assurer de la qualité des résultats.
Ces redressements prennent en compte les spécificités de l’enquête pour corriger le biais de non-réponse, concernant d’une part le questionnaire et d’autre part les auto-prélèvements. Cependant, ces méthodes de correction usuelles ne s’avèrent pas suffisantes pour corriger certaines variables d’intérêt de l’enquête comme les symptômes déclarés dans l’enquête qui ont affecté les répondants. En théorie, le biais observé sur ces variables peut s’expliquer par une erreur de mesure, liée à l’utilisation de plusieurs modes de collecte, ou par l’existence d’une sélection liée, de manière résiduelle, aux variables d’intérêt, non corrigée par les méthodes de correction de la non-réponse sur variables observables. On montre dans ce document que le biais procède d’une sélection liée aux variables d’intérêt et non d'une erreur de mesure associée au mode. Une méthode de correction de la sélection liée aux variables d’intérêt, basée sur un modèle de sélection d’Heckman, est mise en œuvre pour estimer sans biais les valeurs moyennes des variables d’intérêt concernées. Pour les variables de symptômes, la correction peut représenter plus de 50 % du niveau de prévalence déclaré non-corrigé. Cette correction conduit à réduire le niveau de prévalence des symptômes, conformément à l’idée selon laquelle les répondants à l’enquête semblent, en moyenne, davantage affectés par les symptômes de la maladie que les non-répondants.