Données harmonisées des recensements de la population à partir de 1968 Recensement de la population - Fichier détail
Données harmonisées des recensements de la population 1968-2018 Recensement de la population - Fichier détail
Téléchargement des fichiers : mode d'emploi
Pour utiliser ces fichiers volumineux, il est recommandé d'utiliser un gestionnaire de bases de données ou un logiciel statistique. Les fichiers sont disponibles au format dBase ou csv.
- cliquer sur le fichier que vous souhaitez télécharger ;
- enregistrer le fichier sur votre disque dur (format zip) ;
- décompacter le fichier téléchargé dans un répertoire de votre disque dur.
Le fichier des données harmonisées des recensements de la population de 1968 à 2018
Le fichier contient 18 variables et 51 531 570 observations.
Sources
Une présentation générale du recensement de la population est disponible dans la rubrique "Définitions, Méthodes et Qualité" du site insee.fr
Présentation de la source
Le fichier détail de données historiques des recensements de la population contient une sélection d'informations extraites de recensements réalisés entre 1968 et 2020.
Il contient des caractéristiques individuelles de la population, localisées au niveau départemental.
Ces données ont été rassemblées dans un ensemble historique cohérent et innovant, pour être opérationnel auprès de nombreux utilisateurs.
Source et champ couvert
Les recensements font l'objet de deux exploitations statistiques :
- d'une part, l'exploitation principale, qui porte sur l'ensemble des questionnaires collectés, mais en ne traitant qu'une partie des informations y figurant ;
- d'autre part, l'exploitation complémentaire, qui ne porte que sur un échantillon des questionnaires collectés, mais en traitant l'intégralité des informations y figurant
Le fichier est issu des exploitations complémentaires des recensements de la population de 1968, 1975, 1982, 1990, 1999, 2009, 2014 et 2020.
Il concerne la population résidant en France métropolitaine en 1968, 1975, 1982, 1990, 1999, 2009, 2014 et 2020 et la population résidant dans les DOM en 1990, 1999, 2009, 2014 et 2020.
Certains concepts ou définitions ont évolué dans le temps. Ainsi, des nomenclatures, la géographie et les variables spécifiques à chaque recensement, n'ont pas toujours le même contenu. Dans le cadre de l'exploitation historique des recensements de la population, des variables qui pouvaient être différentes d'un recensement à un autre, ont été harmonisées pour pouvoir être comparées.
C'est en particulier le cas de l'âge qui, précédemment exprimé en différence de millésimes, est désormais calculé en années révolues depuis le recensement 2006. Pour assurer la comparabilité avec le passé, il a ainsi été recalculé en années révolues aux recensements précédents.
Attention, cependant, les concepts d'activité et d'emploi retenus depuis 2006 sont plus larges que ceux de 1968-1999 et n'ont pu en être rapprochés.
Contenu du produit
C'est un fichier d'individus cumulés, c'est-à-dire un fichier dans lequel les observations ayant les mêmes modalités pour toutes les variables ont été regroupées. Pour l'utiliser il est donc indispensable d'utiliser une pondération.
Chaque individu est connu, à chaque recensement, à travers ses lieux de naissance, de résidence et de travail. Le niveau géographique retenu dans ce fichier est le département.
Les individus sont également décrits selon des caractéristiques socio-démographiques et quelques données relatives à l'activité.
La résidence antérieure est entendue comme la résidence au 1er janvier :
- 1962, pour le recensement de 1968 ;
- 1968, pour le recensement de 1975 ;
- 1975, pour le recensement de 1982 ;
- 1982, pour le recensement de 1990 ;
- 1990, pour le recensement de 1999 ;
- 1 an plus tôt, pour les recensements 2014 et 2020.
La résidence antérieure n’est pas disponible pour le recensement de 2009.
Autres données issues de cette source
Des bases de données thématiques au niveau communal et au niveau départemental sont également disponibles sur la période 1968-2020.
- Population des 16 ans ou plus selon le niveau de diplôme, le sexe et l'âge de 1968 à 2020 (1990 à 2020 pour les DOM)
- Population selon le sexe et l'âge quinquennal de 1968 à 2020 (1990 à 2020 pour les DOM)
- Structure de la population active de 25 à 54 ans selon la catégorie socioprofessionnelle, selon le niveau de diplôme, selon le sexe ou le secteur d'activité (1968 à 2020)
- Structure de la population active de 15 ans ou plus selon la catégorie socioprofessionnelle, selon le niveau de diplôme, selon le sexe ou le secteur d'activité (1968 à 1999)
Pondération
La variable POND est la pondération à appliquer pour reconstituer la population totale.
Elle combine l'inverse du taux de sondage du recensement, et le nombre d'individus de la population sondée qui ont les mêmes caractéristiques pour toutes les variables retenues dans le fichier détail départemental.
Le fichier est issu des exploitations complémentaires des recensements de la population de 1968 (sondage au 1/4), 1975 (sondage au 1/5), 1982 (sondage au 1/4), 1990 (sondage au 1/4), 1999 (sondage au 1/4), 2009, 2014 et 2020.
En 1968 et 1975, les données du département de la Corse ont été extraites du sondage au 1/20. Elles sont donc à utiliser avec toutes les précautions liées à ce taux de sondage.
En 1990, la population des mariniers et des individus réintégrables non réintégrés (militaires ou internes ayant déclaré avoir une résidence personnelle dans une autre commune, mais dont le bulletin individuel n'a pu être reclassé dans les feuilles de logement de cette autre commune) a fait l'objet d'une saisie exhaustive lourde.
En 1999, certaines zones géographiques traitées à l'exhaustif ont été intégrées à l'exploitation complémentaire. Il s'agit plus particulièrement des deux départements corses, de quelques communes et de certaines zones infracommunales (petites zones urbaines sensibles et certains îlots).
En 2009, 2014 et 2020, les données basées sur des enquêtes annuelles de recensement utilisent un autre principe de pondération, selon que la commune est recensée exhaustivement tous les cinq ans (communes de moins de 10 000 habitants) ou par sondage toutes les années (communes de 10 000 habitants et plus).
Une description de cette pondération est disponible en téléchargement.
Intervalles de confiance
Dans le cas des résultats tirés de l'exploitation complémentaire, il faut prendre en compte une incertitude due à l'échantillonnage.
L'incertitude sur le chiffre est essentiellement fonction de l'effectif à estimer. Par exemple si on veut un intervalle de confiance à 95 % pour le résultat (c'est à dire un intervalle qui a 95 chances sur 100 de recouvrir le résultat que donnerait un dépouillement exhaustif), alors selon le taux de sondage, la vraie valeur de x a 95 % de chance d'être comprise entre les deux bornes déduites des deux formules ci-dessous :
Ces formules sont valables jusqu'au recensement de 1999.
Le tableau ci-dessous donne les intervalles de confiance ainsi calculés pour quelques valeurs de x :
Remarque : les petits nombres peuvent être entachés d'une erreur relative très importante.
Pour les recensements de 2009, 2014 et 2020, il existe également une incertitude due à l'échantillonnage, aussi bien pour l'exploitation principale que pour l'exploitation complémentaire. Pour davantage de précisions, se reporter à la fiche-conseil La précision des résultats du recensement
Modifications territoriales et harmonisation géographique
La géographie de référence des données fournies dans ce fichier (départements et régions de résidence et de travail) est celle du Code Officiel Géographique au 01/01/2022.
Entre 1968 et 2022, de nombreuses modifications territoriales ont été enregistrées, dont quelques-unes affectent le niveau départemental.
Lorsqu'une commune a changé de département entre mars 1968 et janvier 2022, on a affecté ses habitants au département auquel elle appartient en 2022, afin de considérer les départements de façon stable dans le temps.
C'est le cas pour 5 communes :
En 1969, deux communes de l'Essonne, Chateaufort (91143) et Toussus-le-Noble (91620), sont rattachées au département des Yvelines : en géographie 2022, elles appartiennent donc au département 78 (Yvelines).
En 1971, une commune de la Somme, Ytres (80831), est rattachée au Pas-de-Calais : en géographie 2022, elle appartient donc au département 62. Une commune de l'Isère, Colombier-Saugnieu (38119), est rattachée au département du Rhône. En géographie 2022, elle appartient donc au département 69.
En 1997, une commune de la Meuse, Han-devant-Pierrepont (55227), est rattachée au département de la Meurthe-et-Moselle : en géographie 2022, elle appartient donc au département 54.
De plus, 7 communes ont fusionné avec une commune d'un département voisin entre 1968 et 1975. Cela entraîne également la modification du département auquel elles appartenaient en géographie 1968.
Ainsi Escaufourt (02285) est rattachée à Saint-Souplet (59545) et rejoint le département du Nord. Dommerville (28131) est rattachée à Angerville (91016) et rejoint le département de l'Essonne. Antorpe (39012) est rattachée à Saint-Vit (25527) et rejoint le département du Doubs. Sainte-Livière (51494) est rattachée à Éclaron-Braucourt (52182) qui devient Éclaron-Braucourt-Sainte-Livière et appartient au département de la Haute-Marne. Frettes (52210) est rattachée à Champlitte (70122) et rejoint le département de la Haute-Saône. Le-Puy-Saint- Bonnet (79224) est rattachée à Cholet (49099) et rejoint le département du Maine-et-Loire. Enfin, Beauvoir-Rivière (80072) fusionne avec Beauvoir-Wavans (62881) (fusion simple) et rejoint le département du Pas-de-Calais.
Enfin, suite à création de commune nouvelle, en 2016 Gernicourt (02344) est rattachée au département de la Marne et Le Fresne-sur-Loire est rattaché au département du Maine-et-Loire ; et en 2018, Freigné (49144) est rattachée au département de Loire-Atlantique et Pont-Farcy (14513) est rattachée au département de la Manche, Ce dernier mouvement impacte aussi la commune de Pleines-Œuvres (14507) qui avait fusionné avec Pont-Farcy en 1973.
Il faut y ajouter le cas des communes corses : en 1976, le département 20 (Corse) est découpé en deux départements, 2A (Corse du Sud) et 2B (Haute-Corse), selon la loi du 15 mai 1975.
Le département et la région de naissance sont demeurés en géographie courante, c'est-à-dire dans la géographie en vigueur au moment de chaque recensement.
Pour mémoire, les départements à avoir changé d'appellation depuis le recensement de 1968 sont :
- Basses Pyrénées devient Pyrénées-Atlantiques à compter du décret du 10 octobre 1969 ;
- Basses Alpes devient Alpes-de-Haute-Provence à compter du décret du 13 avril 1970 ;
- Côtes-du-Nord devient Côtes-d'Armor à compter du décret du 27 février 1990.
Documentation
Pour en savoir plus
Données harmonisées des recensements de la population 1968-2014, Fichier détail, octobre 2016