Courrier des statistiques N8 - 2022
Une nouvelle enquête Trajectoires et Origines, dix ans après la première Évolutions et innovations dans le protocole de collecte
Trajectoires et Origines est une enquête de référence sur les thèmes de l’immigration et de la diversité de la population française. En explorant l’histoire migratoire des personnes ou de leurs parents, en décrivant leurs parcours (scolaire, professionnel, résidentiel, familial), la transmission des langues et de la religion dans le cadre familial, cette enquête cherche à étudier comment les origines géographiques, nationales, culturelles ou sociales sont susceptibles d’influer sur les conditions de vie et les trajectoires des individus.
La première édition de Trajectoires et Origines (TeO) a été réalisée par l’Insee et l’Ined en 2008-2009 et largement exploitée ; dix ans plus tard, dans un contexte social qui a évolué, la mise à jour des connaissances sur ces sujets devenait nécessaire. La réédition de 2019-2020 va plus loin qu’une simple actualisation des données : elle laisse la place à des évolutions et des innovations dans la conception, le protocole et la méthodologie de l’enquête.
- La France est de longue date un pays d’immigration
- Encadré 1. De qui parle-t-on dans l’enquête TeO ?
- Trajectoires et Origines : une enquête originale
- Une première édition largement exploitée depuis 2009
- Mesurer dix ans d’évolution : continuité de la méthode, adaptation du questionnement
- Encadré 2. Une deuxième édition très attendue
- Encadré 3. TeO2, fruit d’une co-maîtrise d’ouvrage entre l’Insee et l’Ined et d’un large financement
- Un questionnaire aux thématiques élargies
- Un échantillonnage toujours aussi original...
- De nouveaux groupes d’origines : Chinois, réfugiés
- Première interrogation de la « troisième génération »...
- ... et des enfants nés en France de parents « Français de l’étranger »
- Améliorer le suivi des enquêtés qui ont déménagé
- Encadré 4. De la première à la deuxième génération, l’échantillonnage se complexifie
- Comment interroger des personnes non francophones ?
- Des vidéos pour former les enquêteurs... et informer le grand public
- Encadré 5. Une collecte longue qui a dû s’adapter à la crise sanitaire
- Une correction de la non-réponse qui préserve les groupes d’origines...
- Un partage des poids pour tenir compte de l’échantillon en population générale
- Un calage sur marges qui s’appuie sur le recensement
- Une collecte riche qui va nourrir de nombreuses études
- Fondements Juridiques
La France est de longue date un pays d’immigration
En 2020, 10 % de la population résidant sur le territoire national était immigrée, c’est-à-dire née étrangère à l’étranger (voir définitions en encadré 1 et (Insee, 2022a)) : 48 % des immigrés vivant en France sont nés en Afrique, 32 % en Europe, 14 % en Asie, 6 % en Amérique et Océanie. Un peu plus d’un tiers de ces 6,8 millions d’immigrés ont acquis la nationalité française. Les descendants d’immigrés nés en France et y résidant en 2020 sont un peu plus nombreux : 7,4 millions étaient comptabilisés sur le territoire, dont près de 5 millions avaient plus de 18 ans.
Encadré 1. De qui parle-t-on dans l’enquête TeO ?
Un immigré est une personne née étrangère à l’étranger et résidant en France. Les personnes nées françaises à l’étranger et vivant en France ne sont donc pas comptabilisées. À l’inverse, certains immigrés ont pu devenir français, les autres restant étrangers. Un individu continue à être immigré même s’il acquiert la nationalité française. Les personnes nées françaises à l’étranger et vivant en France ne sont pas immigrées.
Un descendant d’immigrés de 2e génération est une personne née en France ayant au moins un parent immigré. Cette appellation ne concerne donc pas les personnes ayant migré étant enfant avec leurs parents.
Un descendant d’immigrés de 3e génération est une personne née en France, ayant au moins un grand-parent immigré et dont aucun parent n’est immigré. Elle peut avoir de un à quatre grands-parents immigrés.
Le terme de 1re génération désigne donc les immigrés (ils sont la première génération à vivre en France). Par suite, les descendants d’immigrés sont dits de 2e ou 3e génération selon qu’ils ont des parents ou des grands-parents immigrés.
Un natif d’outre-mer est une personne née dans un territoire d’outre-mer. Un descendant de natif d’outre-mer est une personne née en France ayant au moins un parent natif d’outre-mer.
Les personnes sans ascendance migratoire directe sont celles qui ne sont ni immigrées, ni descendantes d’immigrés (de 2e génération), et dans le cas spécifique de TeO, ni natives d’outre-mer, ni descendantes de natifs d’outre-mer.
Quel est le parcours familial, résidentiel et professionnel des immigrés depuis leur entrée en France ? Y a-t-il une persistance de l’influence des origines sur les trajectoires sociales des deuxième et troisième générations ? L’intégration des immigrés en France diffère-t-elle selon les origines ? Existe-t-il des discriminations à l’encontre des immigrés et des descendants d’immigrés et, si oui, quelles formes prennent-elles ? Autant de questions qui font l’objet de nombreux débats, voire d’idées reçues.
Comme souvent dans ce genre de contexte, la statistique publique et la recherche sont mises à contribution pour apporter des informations fiables, détaillées et actualisées, permettant de combler un déficit de connaissance et d’objectiver le débat. On peut dans un premier temps vouloir mesurer la diversité d’une société. Ainsi, certains pays réalisent ce qui est parfois appelé des « statistiques ethniques » : c’est le cas par exemple des recensements américain, canadien, brésilien, irlandais et britannique, qui comportent des questions d’appartenance à un groupe « ethno-racial ». Le terme de « statistiques ethniques » ne se voit toutefois pas attribuer le même sens par tous (Le Minez, 2020). En France et conformément au cadre juridique en vigueur, l’Insee et les services statistiques ministériels produisent de nombreuses statistiques fondées sur des données objectives : pays de naissance, nationalité à la naissance, nationalité actuelle, autant d’informations disponibles dans de nombreuses enquêtes et dans le recensement de la population. Muni de ces critères, on peut commencer à identifier et préciser d’éventuelles discriminations ou inégalités de situations auxquelles font face certains groupes de population.
Mais, tout en respectant le cadre juridique, il est aussi possible de se baser sur des informations plus subjectives, en recueillant le « ressenti d’appartenance » des individus ((Le Minez, 2020) et antérieurement (Insee, 2016)). En 2008-2009, une enquête de la statistique publique et de la recherche, baptisée Trajectoires et Origines (TeO), a comporté pour la première fois à grande échelle des questions sur le ressenti d’appartenance. En effet, outre le pays de naissance et la nationalité à la naissance des parents, étaient abordés le lien avec le pays d’origine, la religion, les langues, l’image de soi et le regard des autres. Cette enquête comportait également des questions subjectives sur les injustices et discriminations ressenties dans différents domaines de la vie sociale (accès au logement, à l’emploi, études poursuivies, etc.) et leurs motifs (âge, sexe, état de santé ou handicap, couleur de peau, origines ou nationalité, orientation sexuelle, etc.). Elle a été rééditée une décennie plus tard en 2019-2020, dans un contexte où les thèmes de l’immigration et de la diversité de la population française demeurent au cœur du débat public en France. Dix ans plus tard, TeO a élargi son périmètre d’observation, intégrant de nouvelles populations dont on attend de comprendre si elles font l’objet des mêmes discriminations que celles identifiées avec l’enquête de 2008.
Trajectoires et Origines : une enquête originale
Depuis sa première édition en 2008, Trajectoires et Origines est une enquête de l’Ined, l’institut national des études démographiques, et de l’Insee, l’institut national de la statistique et des études économiques, qui mêle de ce fait des questions intéressant tant la recherche que la statistique publique. TeO étudie la diversité des populations en France et la situation des populations d’origine immigrée ; l’enquête a pour objectif de fournir des informations fiables sur des questions importantes du débat public, comme l’intégration, les inégalités selon l’origine et les discriminations dans la société française.
TeO est originale par la population qu’elle étudie : les personnes immigrées et leurs descendants nés en France, mais également les natifs d’outre-mer et leurs descendants nés en France. Pour disposer d’éléments de comparaison, l’échantillon comprend également des personnes qui sont françaises depuis deux générations ou plus, appelées personnes de la « population majoritaire » ou « sans ascendance migratoire directe » (voir infra). Avec la deuxième édition, TeO2 s’intéresse de plus aux descendants d’immigrés de 3e génération.
La finalité de TeO est également singulière : comprendre comment les origines géographiques, nationales ou culturelles modifient l’accès aux ressources de la vie sociale qui définissent la place de chacun dans la société. TeO couvre ainsi de nombreux aspects des trajectoires individuelles (migratoires, scolaires, professionnelles). Elle collecte des informations d’une nature particulière : pratiques, ressentis et opinions. Certaines questions sont de ce fait « sensibles », notamment celles concernant la religion, la santé et la vie citoyenne : il s’agit autant d’une sensibilité qui peut être ressentie par les enquêtés eux-mêmes que d’une catégorie de données définie dans la loi Informatique et Libertés : « données à caractère personnel qui font apparaître, directement ou indirectement, les origines raciales ou ethniques, les opinions politiques, philosophiques ou religieuses [...] ». Les traitements utilisant ce type de données sont en général interdits ; TeO s’inscrit dans les exceptions prévues par la loi.
Une première édition largement exploitée depuis 2009
TeO1, la première édition de l’enquête (2008-2009), a été réalisée auprès d’un large échantillon (21 800 personnes) (Algava et Lhommeau 2009) dans le but de combler un déficit de données sur les immigrés et les enfants nés en France de parents immigrés. Différentes thématiques y étaient abordées :
- l’entourage familial, l’histoire matrimoniale, les relations sociales ;
- l’accès à l’éducation, au logement, à l’emploi, la santé et la vie citoyenne ;
- les différentes dimensions des origines et appartenances culturelles (lien avec le pays d’origine, religion, langues, image de soi et regard des autres).
Le questionnaire comprenait des éléments rétrospectifs sur les parcours individuels (trajectoires scolaires, professionnelles, familiales et résidentielles), afin d’analyser les processus d’insertion.
Pour mener une enquête statistique, il faut pouvoir constituer une base de sondage appropriée. Or s’il existe des sources statistiques permettant d’identifier les immigrés (recensement, enquête emploi en continu, etc.), celles-ci ne sont pas toujours adaptées pour étudier les descendants d’immigrés. Par ailleurs, les descendants d’immigrés, lorsqu’ils sont identifiés dans les enquêtes de la statistique publique, constituent souvent des échantillons trop petits pour pouvoir établir des analyses selon l’origine détaillée. Les sources administratives ne permettent pas non plus de répondre au besoin : même si elles peuvent informer sur le pays de naissance, elles ne peuvent pas en général informer sur la nationalité à la naissance, ce qui ne permet pas d’identifier les immigrés. Elles ne permettent pas plus d’identifier les descendants d’immigrés.
Afin de produire des informations fiables sur ces populations, l’enquête TeO1 a nécessité un échantillon de 21 800 individus résidant en France métropolitaine, répartis en cinq groupes :
- des immigrés, personnes nées étrangères à l’étranger (parfois dites de « première génération ») ;
- des enfants nés en France de parents immigrés, personnes nées en France ayant un ou deux parents immigrés (descendants de « deuxième génération ») ;
- des personnes nées dans un département d’outre-mer ;
- des personnes nées en France métropolitaine dont au moins un parent est né dans un département d’outre-mer ;
- des personnes représentatives de la population générale, qui en majorité n’appartiennent à aucun des groupes précédents et à partir de laquelle seront identifiées les personnes sans ascendance migratoire directe.
L’enquête TeO1 a donné lieu à une production scientifique importante (figure 1) et sert de référence pour les chercheurs et administrations travaillant sur les questions de la place de l’origine dans les processus d’intégration, de discrimination et de construction identitaire au sein de la société française. TeO1 a permis de mesurer l’ampleur des inégalités sociales et économiques liées aux origines, mais également de rendre compte des formes de participation à la société des immigrés et de leurs descendants et des trajectoires de mobilité sociale qu’ils peuvent suivre.
Figure 1 - L’exploitation de l’enquête Trajectoires et Origines 2008 a alimenté nombre d’études et de publications
*Insee Première, Population & Sociétés, Infos migrations, Dares, Analyses, etc.
Mesurer dix ans d’évolution : continuité de la méthode, adaptation du questionnement
Dix ans après la première enquête, les thèmes de l’immigration et de la diversité de la population française sont toujours au cœur du débat public en France. Mais le contexte social a évolué, avec notamment une diversification des origines des immigrés et une attention accrue aux questions de discriminations. La réédition de l’enquête était donc attendue par les pouvoirs publics, la société civile et les chercheurs (encadré 2). Un des enjeux essentiels de cette deuxième édition était d’assurer des comparaisons avec TeO1 : une décennie plus tard, les constats de TeO1 sont-ils toujours d’actualité ? Le principe de continuité a donc prévalu dans les choix de conception de TeO2, qu’il s’agisse de l’échantillon ou du questionnaire.
Encadré 2. Une deuxième édition très attendue
Le souhait d’un renouvellement de l’enquête a été exprimé à plusieurs reprises dans diverses instances :
- en 2010, le rapport du Comité pour la mesure de la diversité et l’évaluation des discriminations (COMEDD) recommandait la réalisation d’une enquête, renouvelée périodiquement, dédiée à l’étude des discriminations et des inégalités ;
- le souhait de renouveler l’enquête TeO a été exprimé lors de la réunion de la commission « démographie et questions sociales » du CNIS d’octobre 2015, ainsi que par le Défenseur des droits lors de la conférence de presse de présentation des résultats de l’enquête de 2008-2009 le 8 janvier 2016 à l’Ined ;
- TeO2 a, par ailleurs, été inscrite dans le Plan national de lutte contre le racisme et l’antisémitisme (2018-2020), élaboré par la délégation interministérielle à la Lutte contre le racisme, l’antisémitisme et la haine anti-LGBT (DILCRAH) ;
- un indicateur du fort intérêt pour la première édition de l’enquête a été le nombre de demandes d’utilisation des données effectuées auprès du réseau Quételet qui a dépassé les 220.
Cependant, les acteurs du projet (encadré 3) ont introduit des innovations dans les thématiques abordées et le protocole de collecte, pour répondre à certains enjeux, notamment :
- prendre en compte l’évolution de la structure par origine de la population immigrée et apporter des connaissances nouvelles sur des groupes méconnus (chinois, réfugiés, etc.) ;
- étudier les trajectoires des enfants nés en France de parents « Français de l’étranger » (rapatriés d’Algérie ou d’autres territoires coloniaux, expatriés, etc.) ;
- identifier et interroger la « troisième génération » dans le but de mesurer l’impact des origines sur les trajectoires sociales et l’accès aux ressources au fil des générations.
Encadré 3. TeO2, fruit d’une co-maîtrise d’ouvrage entre l’Insee et l’Ined et d’un large financement
La conception et le pilotage de la réalisation de TeO2 sont le fruit d’un travail collectif, qui a associé chercheurs de l’Ined et statisticiens de l’Insee (Ouvrir dans un nouvel ongletIned, 2022). Les deux parties sont intervenues conjointement à tous les stades de l’enquête TeO2. L’Insee a assuré la collecte et son organisation, ainsi que la méthodologie d’enquête et les développements informatiques. L’Ined a piloté les questions d’opportunités de recherche, de la conception du questionnaire à l’exploitation de l’enquête.
Le projet a mobilisé de nombreux acteurs, dans toute une série de groupes ou comités :
- le comité de pilotage : pour prendre les décisions stratégiques, préciser le contour du projet et s’assurer de l’atteinte des objectifs en termes de réalisation, coût et délai ;
- le comité de suivi : pour instruire les questions techniques, coordonner toutes les phases de l’enquête, assurer le suivi de l’exécution, veiller au respect du calendrier de travail et des coûts associés et préparer les éléments pour la prise de décision par le comité de pilotage ;
- le conseil scientifique : instance de consultation, sollicitée par l’un ou l’autre des deux maîtres d’ouvrage en cas de difficulté dans la préparation ou la conduite de l’enquête ;
- le groupe technique dédié à l’échantillonnage : pour instruire la constitution de l’échantillon, faire partager les constats et les contraintes et ainsi faciliter les arbitrages du comité de pilotage ;
- le groupe de conception du questionnaire, assisté de différents groupes thématiques consacrés à l’évolution de chacun des modules ;
- le groupe d’exploitation : pour aider à l’apurement des données et la constitution des fichiers d’étude, puis assurer l’exploitation de l’enquête. Composé des membres du groupe de conception et d’autres chercheurs, chargés d’études et représentants de bailleurs.
Le coût total de l’enquête est estimé à 5,7 millions d’euros dont 3,8 millions d’euros liés à la collecte. Le financement a mobilisé, outre l’Insee et l’Ined, onze organismes :
- Agence nationale de la cohésion des territoires (ANCT) ;
- Caisse nationale des allocations familiales (CNAF) ;
- Défenseur des Droits (DDD) ;
- Délégation interministérielle à la lutte contre le racisme et l’antisémitisme et la haine anti-LGBT (DILCRAH) ;
- Direction générale de la cohésion sociale (DGCS) ;
- France Stratégie ;
- Institut national de la Jeunesse et de l’éducation populaire (INJEP) ;
- Ministère de la Culture ;
- Secrétariat d’État à l’égalité Femmes / Hommes ;
- SSM Travail (Dares, direction de l’animation de la recherche, des études et des statistiques) ;
- SSM Immigration (DSED, département des statistiques, des études et de la documentation du ministère de l’Intérieur).
Un questionnaire aux thématiques élargies
Depuis la première édition, le questionnaire couvre un grand nombre de thèmes (Ouvrir dans un nouvel ongletBeauchemin et alii, 2016) et comprend de nombreux éléments rétrospectifs relatifs aux trajectoires. Le recueil des éléments constitutifs de l’origine, aussi bien géographique que sociale, culturelle ou résidentielle, fait l’objet d’une attention particulière (voir supra). Le thème des discriminations est abordé de façon transversale dans différents modules, et fait également l’objet d’un module spécifique.
Avec TeO2, de nouveaux développements ont été introduits pour élargir les thématiques des études sur les sujets suivants :
- l’analyse de la ségrégation résidentielle et de ses effets sur les processus de discrimination scolaire et professionnelle ;
- les conséquences sur les trajectoires socio-économiques des migrants de leurs caractéristiques pré-migratoires ;
- l’impact des trajectoires légales (statut administratif) des migrants sur leurs conditions d’intégration ;
- les comportements de santé des populations immigrées et leur intégration au sein du système de soins français.
Un échantillonnage toujours aussi original...
Les populations d’intérêt de l’enquête sont toutes des personnes résidant en France métropolitaine. Comme pour la première édition de l’enquête, l’échantillon de TeO2, un peu plus de 50 000 individus, est constitué de cinq sous-échantillons : immigrés (1re génération à vivre en France), descendants d’immigrés de 2e génération, natifs d’outre-mer, descendants de natifs d’outre-mer, et personnes représentatives de la population générale (figure 2).
Figure 2 - L’échantillonnage des première et deuxième générations.
Les quatre premiers sous-échantillons visent à assurer une représentation minimale des groupes dont on pense qu’ils peuvent être soumis à des discriminations du fait de leur origine, quelle que soit leur nationalité.
L’enquête TeO vise aussi à diffuser des résultats selon des groupes d’origines : ce sont des groupes de pays, dont les personnes qui en sont originaires ont potentiellement des histoires très différentes les unes des autres. Ceci implique de disposer de suffisamment de répondants pour chacun d’entre eux. Les sous-échantillons d’immigrés et de descendants d’immigrés ont été stratifiés selon ces groupes d’origines, avec des taux de sondage variables. Les cibles de collecte par groupe ont fait par ailleurs l’objet d’une attention toute particulière.
Pour la 1re génération, on a distingué 11 groupes pour TeO2 : les personnes nées en Algérie ; au Maroc ou en Tunisie ; en Afrique sahélienne ; en Afrique centrale ou dans le golfe de Guinée ; en Espagne, Italie ou Portugal ; dans les autres pays d’Union européenne ; en Turquie ; en Asie du Sud-Est ; en Chine ; dans des pays avec de nombreux réfugiés ; et dans les autres pays. Pour la 2e génération, les groupes étaient légèrement différents (on sépare le Portugal de l’Espagne et de l’Italie, on ne distingue pas la Chine, ni les pays avec de nombreux réfugiés).
De nouveaux groupes d’origines : Chinois, réfugiés
Afin de tenir compte de l’évolution de la structure par origine de la population immigrée et d’apporter des connaissances nouvelles sur des groupes méconnus, il a été décidé de surreprésenter dans l’échantillon de TeO2 :
- un groupe « Chine », dont la population immigrée a crû rapidement au cours des dix dernières années ;
- un groupe constitué de pays d’où sont originaires un grand nombre de réfugiés : Angola, Sri Lanka, Thaïlande, Pakistan, Haïti, Russie, pays de l’ex-Yougoslavie hors Union européenne.
Par ailleurs, l’objectif visé était d’augmenter les effectifs de réfugiés déjà présents dans les groupes d’origine d’intérêt (notamment les deux Congo compris dans le groupe « Afrique centrale et golfe de Guinée » ou le Vietnam, le Laos et le Cambodge inclus dans l’« Asie du Sud-Est »).
Première interrogation de la « troisième génération »...
À la différence de la première édition cependant, l’enquête TeO2 s’intéresse également spécifiquement aux personnes qui ont, soit une ascendance migratoire au-delà de la deuxième génération, soit au moins un parent né français à l’étranger (y compris dans une ancienne colonie). Depuis 2008, davantage d’enfants des descendants d’immigrés de 2e génération sont devenus adultes (voir supra) et la question de la persistance de l’influence des origines sur leurs trajectoires sociales se pose. TeO1 a en effet montré que la situation socio-économique ou le ressenti des discriminations des enfants nés en France d’au moins un parent d’origine maghrébine, africaine subsaharienne, asiatique ou turque s’amélioraient peu ou se dégradaient par rapport aux perceptions des immigrés de même origine. Il s’agissait de savoir si la situation observée pour la deuxième génération d’origine non européenne, se maintient ou disparaît à la génération suivante.
Un des objectifs de l’enquête TeO2 a donc été d’identifier les personnes de la troisième génération, c’est-à-dire les personnes ayant au moins un grand-parent immigré, sans être eux-mêmes ni immigrés, ni descendants d’immigrés. Comme pour la deuxième génération, il n’existe pas de base de sondage permettant d’identifier les descendants de troisième génération. Cela a conduit à mettre en place une méthodologie particulière, avec une stratégie à deux niveaux (figure 3). D’une part, les descendants de troisième génération d’origine européenne sont identifiés directement via le questionnaire de TeO2, grâce à de nouvelles questions sur la nationalité et le pays de naissance des quatre grands-parents. Suffisamment nombreux dans le sous-échantillon de la population générale, ils peuvent faire l’objet d’analyses sans nécessiter de surreprésentation particulière. D’autre part, les descendants d’immigrés de troisième génération d’origine non européenne, a priori moins nombreux, ont fait l’objet d’une enquête complémentaire expérimentale (TeO2-G3). Ses résultats devront éclairer les situations de discrimination ou de racisme perçues par une partie de la population majoritaire dans la première enquête, et qui pourraient être expliquées par la présence, au sein de cette population, de personnes d’origines migratoires plus anciennes. L’échantillon de cette enquête complémentaire a été constitué, par sondage indirect : l’enquête TeO2 sur les descendants d’immigrés comportait en effet des questions sur les enfants des enquêtés, qu’ils résident ou non dans le logement de leurs parents. Le protocole prévoyait un module de prise de contact et de sélection des personnes de troisième génération à la toute fin du questionnaire pour vérifier l’éligibilité des enfants et collecter leurs coordonnées (adresses postale et électronique, téléphone). Un délai a été laissé aux parents pour échanger avec leurs enfants et s’assurer de leur accord, cette partie du questionnement n’étant pas obligatoire.
Figure 3 - L’échantillonnage de la troisième génération.
Sur le millier d’individus adultes éligibles, on ne disposait de coordonnées que pour un tiers : 240 personnes ont été interrogées entre mars 2020 et janvier 2021, à travers quatre vagues de collecte. Le questionnaire était identique à celui de l’enquête TeO2.
... et des enfants nés en France de parents « Français de l’étranger »
Dans TeO1, les personnes nées en France de parents nés de nationalité française à l’étranger, étaient considérées comme hors champ. Elles n’ont donc répondu qu’à un questionnaire tronqué. Ainsi, pour environ 3 000 individus, l’entretien débutait mais était interrompu dès que l’enquêté répondait que son ou ses parents nés à l’étranger étaient nés français. Dans l’enquête TeO2, il a été décidé de poursuivre le questionnement jusqu’au bout. Les trajectoires de ces personnes constituent un domaine de recherche encore peu étudié. Avec TeO2, on va pouvoir, par exemple, comparer leur parcours migratoire à celui des personnes dont les parents immigrés sont nés dans le même pays.
Améliorer le suivi des enquêtés qui ont déménagé
Comme TeO1, l’enquête TeO2 est réalisée auprès des individus et menée en face-à-face par les enquêteurs de l’Insee. Ces enquêtes présentent une difficulté supplémentaire par rapport aux enquêtes classiques auprès des ménages, où ce sont des logements qui sont échantillonnés (Sillard et alii, 2020). En effet, les individus ayant déménagé doivent faire l’objet d’un traitement particulier, afin de pouvoir les interroger.
Dans le cadre de l’enquête TeO2 (encadré 4), la base de sondage étant le recensement de 2018, lorsqu’une personne a été tirée, l’enquêteur dispose pour la joindre de ses nom, prénom et adresse en 2018. Or, les immigrés et leurs descendants déménagent plus souvent que la population sans ascendance migratoire. Les enquêteurs ont donc pour consigne de chercher la nouvelle adresse de ces personnes.
Encadré 4. De la première à la deuxième génération, l’échantillonnage se complexifie
Pour les immigrés, les natifs d’outre-mer, leurs descendants de 2e génération, le principe général de la méthode d’échantillonnage de TeO1 (Algava et Lhommeau, 2013) a été reconduit dans TeO2 (Merly-Alpa, Paliod et Thao Khamsing, Ouvrir dans un nouvel onglet2021 ; 2022) : les immigrés et natifs d’outre-mer sont sélectionnés directement dans l’enquête annuelle de recensement* ; mais ce n’est pas possible pour les descendants d’immigrés ou de domiens, car l’information sur le lieu de naissance des parents et sur leur nationalité à la naissance est absente de cette source, on a donc conçu un dispositif ad hoc.
On recherche des candidats potentiels dans l’enquête annuelle du recensement, i.e. toutes les personnes de 18-59 ans, nées en France métropolitaine, hors immigrés et natifs d’outre-mer, soit plus de 2 millions d’individus.
Puis on apparie ces données avec le fichier anonyme** d’état civil dont dispose l’Insee pour les individus nés après 1968, en vue d’enlever les personnes qui n’ont aucun parent né à l’étranger ou dans les Dom. Ce sont de potentiels descendants d’immigrés ou de natifs d’outre-mer.
On vérifie ensuite, dans les bulletins de naissance en mairie, qu’il s’agit bien de descendants de personnes nées à l’étranger ou dans les Dom ; au préalable et afin de limiter les coûts des recherches, un tirage d’individus a été effectué. Cette consultation des bulletins de naissance en mairie, sur lesquels figurent les lieux de naissance des parents (mais pas leur nationalité), est une opération atypique et spécifique à TeO. Elle a concerné environ 100 000 personnes.
L’opération aboutit à la construction d’une base de sondage de descendants de personnes nées à l’étranger ou dans les Dom.
Pour les personnes dont au moins un parent est né à l’étranger, le tirage avec surreprésentation des groupes d’origines peut être effectué, en se basant sur le pays de naissance des parents. Il restera à vérifier la nationalité de naissance des parents, pour déterminer précisément les descendants d’immigrés***. C’est à partir du questionnaire de l’enquête TeO2 que l’on recueille cette information. Bien que coûteuse et risquée à l’origine, cette méthode d’échantillonnage est apparue comme un succès.
* EAR de 2018 pour TeO2.
** La base STATEC contient une information sur le sexe, la date et le lieu de naissance.
L’appariement sur ces traits d’identité permet de récupérer un ou plusieurs individus
correspondant, dont on connaît le lieu de naissance des parents.
*** L’opération permet de ne pas confondre les descendants d’immigrés avec les descendants
de Français nés à l’étranger.
Pour retrouver les personnes ayant déménagé, les enquêteurs ont eu recours à :
- des informations issues du terrain (habitants actuels du logement, voisinage, mairie, etc.) ;
- la consultation de l’annuaire et la recherche internet ;
- les coordonnées (adresse mail et téléphone) récupérées grâce à l’appariement de la base de sondage TeO2 avec les fichiers de la taxe d’habitation. Cet appariement non standard est techniquement possible et l’utilisation des données des fichiers d’imposition des personnes est juridiquement autorisée. Cela a fait l’objet d’une déclaration générique par l’Insee à la Cnil, couvrant l’ensemble des enquêtes.
Comment interroger des personnes non francophones ?
Répondre à une enquête multi-thématique et relativement longue comme TeO2 demande une bonne maîtrise de la langue française. De plus, sont surreprésentées dans l’échantillon des personnes potentiellement peu francophones, par exemple, les immigrés chinois. Il était donc essentiel de mettre en œuvre une méthodologie permettant d’enquêter dans des conditions satisfaisantes la population immigrée, quel que soit son niveau en français.
Le protocole dans TeO1 supposait que l’enquêteur puisse contacter un interprète s’il identifiait des difficultés rédhibitoires pour la conduite de l’entretien en français. La difficulté majeure était de réussir à mettre en place des rendez-vous à trois (enquêteur, enquêté et traducteur). Pour l’enquête TeO2, un nouveau protocole a été mis en place pour faciliter ces entretiens :
- en l’absence d’un tiers pouvant traduire (cas d’enquêtés non francophones isolés), les enquêteurs étaient chargés d’identifier la langue parlée par l’enquêté. Pour cela, lors de leur visite, ils disposaient d’une fiche de contact traduite en 22 langues ;
- l’entretien était réalisé dans un deuxième temps par des enquêteurs traducteurs de l’Ined (enquête de rattrapage des non francophones).
Des vidéos pour former les enquêteurs... et informer le grand public
L’originalité de l’enquête et son protocole particulier justifiait d’utiliser le support vidéo pour la formation des gestionnaires d’enquête et des enquêteurs. Ainsi, six courtes séquences vidéos ont été produites entre mars et septembre 2019 pour expliquer les objectifs de l’enquête, ses enjeux et le protocole de collecte.
La première séquence explique les objectifs de l’enquête et ses enjeux. Les deux suivantes (nationalités, trajectoires légales des migrants) portent sur deux modules du questionnaire qui recouvrent des concepts peu standards dans les enquêtes de la statistique publique. Il a paru important que les enquêteurs s’approprient au mieux ces notions avant la réalisation de l’enquête. Deux autres séquences (interrogation des non francophones, interrogation des troisièmes générations) portent sur les protocoles de collecte particuliers. Enfin, le questionnaire comportant des questions sensibles dans trois de ses modules (religion, santé, vie citoyenne), il a semblé nécessaire de sensibiliser les enquêteurs et le grand public sur cet aspect dans une sixième vidéo.
L’équipe de conception a également proposé de mettre à disposition du grand public deux de ces vidéos : celle sur la présentation de l’enquête et celle sur le traitement des données sensibles. Celles-ci sont mises en ligne sur le site de l’Insee (Insee, 2021), le site TeO2 (Ouvrir dans un nouvel ongletIned, 2022) et sur la chaîne YouTube de l’Insee (Insee, Ouvrir dans un nouvel onglet2019a et Ouvrir dans un nouvel onglet2019b).
Le bilan de cette opération a été très positif. Ces vidéos ont été très appréciées, que ce soit par les enquêteurs ou enquêtés et par les gestionnaires pour leur formation auprès des enquêteurs, comme en témoignent les bilans d’enquête réalisés auprès de ces acteurs.
L’enquête principale s’est déroulée entre juillet 2019 et novembre 2020. 27 000 personnes, âgées de 18 à 59 ans, de toutes origines, y ont répondu (54 % de l’échantillon initial). Environ 240 personnes ont répondu à l’enquête expérimentale sur 360 qui pouvaient être contactées (encadré 5).
Encadré 5. Une collecte longue qui a dû s’adapter à la crise sanitaire
La collecte de l’enquête TeO2 était organisée en deux vagues. La première vague concernait la collecte du sous-échantillon des immigrés, des natifs d’outre-mer et de la population générale et a eu lieu du 1er juillet au 31 décembre 2019, sur 26 semaines ininterrompues.
La deuxième vague de l’enquête TeO2 a débuté le 1er janvier 2020. Elle concernait les sous-échantillons des personnes dont les parents sont nés à l’étranger et dans les Dom. À compter du mois de mars 2020, la collecte a été interrompue trois mois en raison de la crise sanitaire. À la suite du déconfinement, une expérimentation a été mise en place afin de tester la reprise de la collecte en face-à-face. À l’issue de celle-ci, le protocole a été adapté (nouvelles lettres avis reprenant le protocole sanitaire, autorisation partielle du téléphone, etc.) et la fin de la collecte a été repoussée de deux mois jusque fin novembre 2020. À la suite de l’annonce du deuxième confinement (29 octobre 2020), il a été décidé que la fin de collecte de l’enquête TeO2 se ferait exclusivement par téléphone.
L’enquête TeO2 a permis d’interroger environ 27 000 individus.
La collecte de l’enquête expérimentale TeO2-G3 a débuté le 10 mars 2020 et a été presque immédiatement interrompue par le premier confinement. Après la reprise de la collecte en juillet 2020, le taux de collecte est resté faible. Avec le deuxième confinement, il a été décidé de prolonger la collecte des individus de troisième générat ion déjà repérés jusqu’au 15 décembre 2020, puis d’interroger un quatrième lot d’individus au mois de janvier 2021.
L’enquête expérimentale TeO2-G3 a permis d’interroger environ 240 individus, pour un objectif initialement fixé à 500.
Une fois la collecte réalisée, l’enjeu était ensuite de s’assurer de la représentativité des répondants. Classiquement, l’étape du redressement vise à corriger l’échantillon de ses éventuelles déformations par rapport à la population cible, dues à la non-réponse.
Cependant, cette enquête a posé quelques défis méthodologiques en termes de redressement, que ce soit dans les opérations dédiées (correction de la non-réponse, partage des poids, calage sur marge) ou dans l’articulation de ces trois opérations (Guin et Thao Khamsing, Ouvrir dans un nouvel onglet2021a et Ouvrir dans un nouvel onglet2021b).
Une correction de la non-réponse qui préserve les groupes d’origines...
La collecte de l’enquête TeO2 s’est traduite par une déperdition de l’échantillon mis en collecte initialement. Afin de maintenir la représentativité de l’échantillon final obtenu, des travaux méthodologiques de redressement de l’échantillon ont donc été menés.
La non-réponse à l’enquête réduit la taille de l’échantillon exploitable. Ce dernier n’est dès lors plus représentatif de l’ensemble de la population. Pour compenser le biais introduit par les non-répondants, il est nécessaire de corriger les poids attribués aux individus de l’échantillon de façon à réaffecter le poids des personnes qui n’ont pas répondu. L’étape de correction de la non-réponse totale consiste à estimer parmi les répondants et les non-répondants, la probabilité de répondre en fonction des caractéristiques disponibles sur l’ensemble de ce champ. Le poids initial des répondants (inverse de la probabilité d’inclusion dans l’échantillon tiré dans la base de sondage) est ensuite corrigé en le multipliant par l’inverse de la probabilité de réponse estimée. Cette opération permet de corriger la non-réponse totale et de rendre ainsi l’échantillon des répondants représentatif de l’ensemble du champ de l’enquête.
La prise en compte des enjeux de diffusion de l’enquête par groupes d’origines a orienté la correction de la non-réponse vers une approche multi-modèle par groupes d’origines.
Un partage des poids pour tenir compte de l’échantillon en population générale
Parmi les cinq sous-échantillons cités plus haut, celui issu de la population générale est représentatif de l’ensemble de la population. Il comprend donc des individus appartenant à toutes les populations d’intérêt de l’enquête. Par construction, immigrés, natifs d’outre-mer, descendants de 2e génération ou descendants de natif d’outre-mer, chacun pouvait potentiellement être sélectionné via le sous-échantillon de la population générale ou via le sous-échantillon spécifique à ces groupes d’intérêt.
L’opération de partage des poids (Lavallée, 2009) a consisté à repérer a posteriori (avec les informations de la collecte sur les répondants), les individus qui potentiellement pouvaient être sélectionnés dans deux sous-échantillons et à corriger leur poids. Encore une fois pour répondre aux enjeux de diffusion de l’enquête par groupes d’origines, l’opération du partage des poids a été adaptée pour prendre en compte les origines des individus (méthode des liens pondérés).
Un calage sur marges qui s’appuie sur le recensement
À l’issue de l’opération du partage des poids, on obtenait donc un jeu de pondération unique sur l’échantillon des répondants. L’objectif du calage sur marges (Ouvrir dans un nouvel ongletDeville et Särndal, 1992) est double :
- assurer une cohérence entre les totaux estimés de certaines variables (dites variables de calage) et les vrais totaux de ces variables connus, par une information externe, sur la population ;
- réduire la variance des estimateurs des variables d’intérêt de l’enquête.
La procédure du calage a porté sur trois populations : les immigrés, les natifs d’outre-mer, les « autres » (ni immigrés, ni natifs d’outre-mer).
Le calage nécessite de disposer d’une source externe qui fournisse les totaux connus de variables auxiliaires (les marges). La source de référence retenue pour le calcul des marges a été l’enquête annuelle de recensement de l’année 2019, couplée avec celle de 2020 (qui donne une photographie de la population en moyenne sur l’année 2019). La taille de cette source – près de 5 millions d’observations sur le champ de TeO2 – est son principal avantage. En particulier, elle permet de mesurer des caractéristiques sur les populations rares comme les natifs d’outre-mer (qui représentent moins de 1 % de la population).
Une vigilance a été portée dans le choix des marges pour éviter les différences de concept entre les marges de la population estimée à partir de la source externe et les variables correspondantes collectées pour l’échantillon de l’enquête. Par exemple, le niveau de diplôme est une information qui existe dans le recensement mais qui n’a pas été retenue dans le calage : l’interrogation est en effet très différente entre le recensement (variable auto-déclarée) et TeO (codification sur le poste de collecte).
Une collecte riche qui va nourrir de nombreuses études
Dans le système statistique français, l’enquête TeO est une enquête particulière à plusieurs titres. Réalisée deux fois à ce stade, elle est le fruit d’une collaboration entre la recherche et la statistique publique. Si cette dernière produit de nombreuses études sur l’immigration et l’intégration à partir d’autres sources comme l’enquête Emploi ou le recensement de la population, l’enquête TeO aborde des thèmes habituellement peu traités comme les discriminations, la religion, la vie citoyenne et interroge des populations difficiles à identifier et à caractériser dans les sources administratives et les enquêtes existantes.
Tout en cherchant à répondre à des objectifs de comparabilité et d’actualisation, TeO2 a laissé place à des évolutions (questionnaire, choix d’interroger de nouveaux groupes de personnes) mais également à des innovations en particulier pour identifier les personnes de la troisième génération. L’absence d’une base de sondage permettant d’échantillonner ces personnes a conduit à développer des méthodes sophistiquées dans le plan de sondage, le protocole d’enquête et les travaux post collecte.
Ainsi, de multiples compétences ont été mobilisées et il a également fallu être réactif et s’adapter tout au long de la conception et la réalisation de l’enquête. Bien que longue et perturbée par le contexte sanitaire, la collecte a tout de même permis d’atteindre une taille d’échantillon suffisamment importante (plus de 27 000 individus) pour mener des analyses détaillées selon la plupart des groupes d’origines ciblés par l’enquête. Les premiers résultats issus de l’enquête ont été diffusés par l’Insee et l’Ined en juillet 2022 ((Lê, et alii, 2022), (Lê, Simon et Coulmont, 2022) et (Ouvrir dans un nouvel ongletBeauchemin, Ichou, Simon et alii, 2022)). Les prochaines années devraient voir la publication de nombreuses études et analyses valorisant les nombreuses dimensions de TeO2, que ce soit pour actualiser les constats de TeO1 ou pour exploiter les innovations de cette deuxième édition. Chacun est invité à contribuer à cette exploitation.
Fondements Juridiques
Ouvrir dans un nouvel ongletLoi n° 78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés. In : site de Légifrance. [en ligne]. Mise à jour le 26 janvier 2022. [Consulté le 18 octobre 2022].
Paru le :29/11/2022
Hors département de Mayotte.
Cet article est pour l’essentiel une synthèse d’un document de travail paru en juillet 2022 (Thao Khamsing, Guin, Merly-Alpa, Paliod, 2022), qui a également bénéficié des contributions de Cris Beauchemin, Mathieu Ichou et Patrick Simon (Ined), Odile Rouhban et Pierre Tanneau (Insee).
Voir références juridiques en fin d’article.
Pays qui comptaient plus de 20 % de réfugiés dans TeO1 et dont l’effectif est supérieur à 1 000 individus dans l’enquête annuelle du recensement de 2013.
Par exemple les rapatriés d’Algérie ou d’autres territoires coloniaux, les expatriés, etc.
Anglais, turc, arabe, vietnamien, portugais, espagnol, mandarin, laotien, russe, tamoul, serbe, croate, allemand, khmer, bengali, thaï, pachto, roumain, albanais, géorgien, lituanien et tchèque.
Ne sont présentées ici que les idées générales. La chaîne de redressement est décrite dans le détail dans (Thao Khamsing, Guin, Merly-Alpa, Paliod, 2022). Cette partie n’aborde pas le redressement de l’enquête expérimentale sur les descendants de 3e génération (TeO2-G3).
Et augmente de ce fait la variance des estimateurs.
L’enquête TeO2 est déjà stratifiée en groupes d’origines ; il s’agit ici d’envisager des agrégations de ces groupes d’origines.
Méthode des liens pondérés proposée par (Davezies, Landré, Murat et Rousseau, 2005).
Sexe, âge, couple, type de logement, nationalité, pays de naissance d’origine, région de résidence, tranche d’unité urbaine, etc.
Pour en savoir plus
ALGAVA, Élisabeth et LHOMMEAU, Bertrand, 2009. T’es où TeO ? À la recherche de la 2e génération pour l’enquête Trajectoires et origines. In : Actes des 10e Journées de Méthodologie Statistique (JMS). [en ligne]. 23-25 mars 2009. Insee, Session 24. [Consulté le 25 juillet 2022].
ALGAVA, Élisabeth et LHOMMEAU, Bertrand, 2013. À l’origine de l’enquête TeO : enjeux de l’échantillonnage, collecte et pondérations de l’enquête TeO. [en ligne]. 19 avril 2013. Insee, Documents de travail, n° F1304. [Consulté le 25 juillet 2022].
BEAUCHEMIN, Cris, HAMEL, Christelle et SIMON, Patrick, 2016. Ouvrir dans un nouvel ongletTrajectoires et origines. Enquête sur la diversité des populations en France. Ined, Collection Grandes Enquêtes, ouvrage collectif : ISBN 978-2-7332-8004-1.
BEAUCHEMIN, Cris, ICHOU, Mathieu, SIMON, Patrick et alii, 2022. Ouvrir dans un nouvel ongletFamilles immigrées : le niveau d’éducation progresse sur trois générations mais les inégalités sociales persistent. In : Population et Sociétés 2022/7. [en ligne]. Juillet-août 2022. Ined, n° 602, pp. 1-4. [Consulté le 25 juillet 2022].
DAVEZIES, Laurent, LANDRÉ, Cédric, MURAT, Fabrice et ROUSSEAU, Sylvie, 2005. Problèmes théoriques et pratiques de la mise en œuvre d’une sur-représentation des ZUS dans les échantillons d’enquête : le cas de l’enquête IVQ. In : Actes des 9e Journées de Méthodologie Statistique (JMS). [en ligne]. 14-16 mars 2005. Insee, Session 3. [Consulté le 25 juillet 2022].
DEVILLE, Jean-Claude et SÄRNDAL, Carl-Erik, 1992. Ouvrir dans un nouvel ongletCalibration Estimators in Survey Sampling. In : Journal of the American Statistical Association. Juin 1992. Taylor & Francis, Ltd. on behalf of the AAS. Vol. 87, n° 418, pp. 376-382. [Consulté le 25 juillet 2022].
GUIN, Olivier et THAO KHAMSING, Willy, 2021a. Ouvrir dans un nouvel ongletPartage des poids pour l’enquête Trajectoires et Origines 2 (TeO2). In : Actes du 11e Colloque International Francophone sur les Sondages. [en ligne]. 6-8 octobre 2021. Société française de statistique (SFdS) et Université libre de Bruxelles (ULB). [Consulté le 25 juillet 2022].
GUIN, Olivier et THAO KHAMSING, Willy, 2021b. Ouvrir dans un nouvel ongletRedressements de l’enquête Trajectoires et Origines 2 (TeO2). In : Actes du 11e Colloque International Francophone sur les Sondages. [en ligne]. 6-8 octobre 2021. Société française de statistique (SFdS) et Université libre de Bruxelles (ULB). [Consulté le 25 juillet 2022].
THAO KHAMSING, Willy, GUIN, Olivier, MERLY-ALPA, Thomas et PALIOD, Nicolas, 2022. Enquête Trajectoires et Origines 2. De la conception à la réalisation. [en ligne]. 21 juillet 2022. Insee, Documents de travail, n°2022/02. [Consulté le 25 juillet 2022].
INED, 2022. Ouvrir dans un nouvel ongletEnquête sur la diversité des populations en France. In : site de l’Ined. [en ligne]. [Consulté le 25 juillet 2022].
INSEE, 2012. Immigrés et descendants d’immigrés en France. Édition 2012. [en ligne]. 10 octobre 2012. Insee Références. [Consulté le 25 juillet 2022].
INSEE, 2016. Pour comprendre... La mesure des populations étrangère et immigrée. [en ligne]. Collection Insee en bref. [Consulté le 25 juillet 2022].
INSEE, 2019a. Ouvrir dans un nouvel ongletEnquête TeO2 – Trajectoires et origines 2. [en ligne]. 10 juillet 2019. [Consulté le 25 juillet 2022].
INSEE, 2019b. Ouvrir dans un nouvel ongletLes données sensibles dans TeO2. [en ligne]. 23 août 2019. [Consulté le 25 juillet 2022].
INSEE, 2021. Trajectoires et Origines 2 : enquête sur la diversité des populations en France. In : site de l’Insee. [en ligne]. 09 mars 2021. [Consulté le 25 juillet 2022].
INSEE, 2022a. L’essentiel sur... les immigrés et les étrangers. [en ligne]. 10 août 2022. Insee, Chiffres clés. [Consulté le 11 septembre 2022].
LAVALLÉE, Pierre, 2009. Indirect sampling. Éditions Springer, Science & Business ISBN 978-0-387-70778-5.
LE MINEZ, Sylvie, 2020. Oui, la statistique publique produit des statistiques ethniques. Panorama d’une pratique ancienne, encadrée et évolutive. In : Le blog de l’Insee. [en ligne]. 31 juillet 2020. Insee. [Consulté le 25 juillet 2022].
LÊ, Jérôme, ROUHBAN, Odile, TANNEAU, Pierre, BEAUCHEMIN, Cris, ICHOU, Mathieu et SIMON, Patrick, 2022. En dix ans, le sentiment de discrimination augmente, porté par les femmes et le motif sexiste. [en ligne]. 5 juillet 2022. Insee Première n° 1911. [Consulté le 25 juillet 2022].
LÊ, Jérôme, SIMON, Patrick et COULMONT, Baptiste, 2022. La diversité des origines et la mixité des unions progressent au fil des générations. [en ligne]. 5 juillet 2022. Insee Première n° 1910.[Consulté le 25 juillet 2022].
MERLY-ALPA, Thomas, PALIOD, Nicolas et THAO KHAMSING, Willy, 2021. Ouvrir dans un nouvel ongletÉchantillonnage de l’enquête Trajectoires et Origines 2. In : Actes du 11e Colloque International Francophone sur les Sondages. [en ligne]. 6-8 octobre 2021. Société française de statistique (SFdS) et Université libre de Bruxelles (ULB). [Consulté le 25 juillet 2022].
MERLY-ALPA, Thomas, PALIOD, Nicolas et THAO KHAMSING, Willy, 2022. Échantillonnage de l’enquête Trajectoires et Origines 2. In : Actes des 14e Journées de Méthodologie Statistique (JMS). [en ligne]. 29-31 mars 2022. Insee, Session 24. [Consulté le 25 juillet 2022].
SILLARD, Patrick, FAIVRE, Sébastien, PALIOD, Nicolas et VINCENT, Ludovic, 2020. Pour les enquêtes auprès des ménages, l’Insee rénove ses échantillons. In : Courrier des statistiques. [en ligne]. 29 juin 2020. Insee. N° N4, pp. 81-100. [Consulté le 25 juillet 2022].