Les estimations par capture-recapture ou par système multiple : quelques éléments théoriques
Le dénombrement des populations compte parmi les principaux objectifs de la statistique publique. Lorsqu’on ne peut pas pratiquer de recensement, mais que l’on dispose de plusieurs (au moins deux) sources offrant chacune une couverture partielle de la population dont il faut estimer la taille, il est possible d’utiliser une méthode dite de « capture-recapture ». La théorie associée à cette méthode considère que chaque individu de la population a, pour chacune des sources considérées, une probabilité spécifique de lui appartenir. Elle s’appuie à la base sur des hypothèses fortes et multiples. L’hypothèse absolument contraignante, sans échappatoire possible, est celle de la connaissance des intersections entre sources : sur elle, repose le fondement des méthodes de capture-recapture. Par ailleurs, ces sources ne doivent pas, après traitements éventuels, contenir d’enregistrements traduisant une sur-couverture de la population réelle. Côté individus, la technique de base – conduisant à l’estimateur de Lincoln-Petersen – suppose que l’éventuelle présence d’un individu dans une source donnée est indépendante de son éventuelle présence dans toute autre source, et qu’elle est par ailleurs indépendante de l’éventuelle présence de tout autre individu dans cette même source. Il faut enfin supposer que les probabilités d’appartenance à une source quelconque dépendent de la source mais ne dépendent pas de l’individu. Le développement des méthodes présentées dans ce document est structuré autour du relâchement de tout ou partie de ces hypothèses.