Panorama des principales méthodes d'estimation sur les petits domaines

Pascal ARDILLY

Lorsqu'on souhaite estimer des paramètres à partir de données 'enquête par sondage (taux de chômage, proportion de « pauvres », etc…), on se trouve souvent confronté au problème de la médiocre qualité des estimations relatives aux sous populations (appelées « domaines ») de petite taille. C'est une conséquence mécanique de la faible taille de l'échantillon qui recoupe ces domaines, qui sont en général de « petites » aires, comme par exemple des départements ou des agglomérations. Il est alors nécessaire d'utiliser de l'information auxiliaire venant de sources exhaustives ou issues d'enquêtes par sondage de très grande taille (par exemple les enquêtes de recensement) et de modéliser les indicateurs en fonction des variables ayant un bon pouvoir explicatif. Sur ce point, la théorie offre d'assez nombreuses pistes, mais l'expérience française en la matière est encore fort limitée. Dans ce contexte, le présent document expose les principales méthodes d'estimation sur petits domaines, incluant à la fois les estimateurs justifiables par la théorie des sondages et ceux qui reposent sur la modélisation classique (modèles linéaires mixtes, modèles linéaires généralisés, et procédures bayésiennes).

Documents de travail
No M0602
Paru le : 01/09/2006