Aller au contenu

Aller au menu principal

Aller à la recherche

Liens transversaux haut

Documentation sur les nouvelles données

mars 2013

Source des données

  • Revenus Fiscaux Localisés (RFL) au 31/12/2010
  • Taxe d'habitation (TH) au 1/1/2011

L'Insee a obtenu l'accord de la CNIL pour la diffusion de ces nouvelles données au carreau sur son site.

On peut se reporter à la documentation de l'exploitation RFL.

Les revenus fiscaux localisés des ménages sont établis à partir des fichiers exhaustifs des déclarations de revenus des personnes physiques, de la taxe d'habitation et du fichier d'imposition des personnes physiques fournis à l'Insee par la Direction générale des finances publiques.

L'exploitation conjointe de ces sources fiscales permet de produire des statistiques sur les revenus fiscaux localisés des ménages à l'échelle communale, supra communale et infra communale pour la France métropolitaine et deux départements de l'outre-mer (DOM) : La Réunion et la Martinique.

La qualité d'appariement des fichiers fiscaux de la Guadeloupe et de la Guyane ne permet pas de reconstituer les ménages fiscaux comme pour la France métropolitaine, la Réunion et la Martinique. C'est pourquoi les statistiques sur les revenus ne sont pas produits pour ces deux DOM.

Un ménage fiscal est un ménage constitué par le regroupement des foyers fiscaux répertoriés dans un même logement (hors logement collectif). Son existence, une année donnée, tient au fait que coïncident une déclaration indépendante de revenus (dite déclaration n° 2042) et l'occupation d'un logement connu à la taxe d'habitation (TH).

Les règles fiscales autorisent les parents à rattacher leurs enfants majeurs ou mariés sur leur propre déclaration de revenus s'ils sont âgés de moins de 21 ans quelle que soit leur situation, ou s'ils sont âgés de moins de 25 ans et poursuivent leurs études.

Les enfants majeurs rattachés à la déclaration fiscale de leurs parents peuvent occuper un logement indépendant. Par défaut, ils sont pourtant inclus dans le ménage de leurs parents.

Cette situation concerne essentiellement des étudiants. Par comparaison avec le recensement de la population, cela génère une sous-estimation du nombre de ménages et d'habitants des villes étudiantes et une surestimation de la taille des ménages des parents.

Méthodes de floutage des données

La méthodologie mise en œuvre vise à s'assurer qu'aucune procédure ne permettrait d'identifier ou d'estimer de façon précise les données individuelles de revenu des ménages, ainsi que toutes les autres caractéristiques des individus ou des ménages.

Elle s'appuie sur une analyse statistique préalable des risques.

Les données sont considérées à risque dans les sept cas suivants :

  • Moins de 11 ménages pour une « maille » quelconque
  • Ménages d'une « maille isolée » ou ensemble de « mailles isolées » représentant une population de moins de 80 ménages
  • Ménages des « mailles » où le ratio du nombre de résidences secondaires dépasse un seuil s (*) tel qu'observé dans l'ensemble de la commune
  • Ménages des « mailles » où le ratio du nombre de ménages au dessus du revenu médian de la commune dépasse un seuil s tel qu'observé dans l'ensemble de la commune
  • Ménages des « mailles » où le ratio du nombre de ménages en dessous du revenu médian de la commune dépasse le seuil s tel qu'observé dans l'ensemble de la commune
  • Ménages des « mailles » appartenant à un zonage (commune, Iris) représentant moins de 200 ménages
  • Ménages des « mailles » où le ratio du nombre de ménages de 5 personnes ou plus dépasse le seuil s tel qu'observé dans l'ensemble de la commune

(*) s est le dernier décile de la distribution du ratio sur l'ensemble des mailles de la commune.

Le traitement des données consiste en un « floutage » des fichiers individuels, tant sur le plan de la localisation des individus que sur les variables les décrivant :

  • permutation des ménages à risque avec des ménages des mailles voisines.
  • substitution d'un revenu calculé au revenu brut d'origine, le revenu de chaque ménage étant calculé à partir de la distribution des revenus des ménages comparables observés sur une zone large environnante (**).
  • imputation du nombre de personnes de 65 ans et plus et du type de résidence (principale/secondaire) en cas de « maille isolée » ou d'ensemble de « mailles isolées » (***).

(**) On effectue un tirage aléatoire dans la distribution théorique ajustée à la distribution observée res revenus des ménages ayant le même statut d'occupation du logement (propriétaire /locataire) et même situation au regard de l'impôt (imposable / non imposable) sur une zone environnante contenant au moins 2 000 ménages.

(***) tirage aléatoire en fonction des proportions observées suivant les mêmes critères que ci-dessus

La procédure d'imputation est appliquée lorsque la procédure de permutation ne peut être appliquée.

Les ménages relevant de l'un des trois premiers risques énumérés ci-dessus sont traités exhaustivement. Ceux relevant des deux risques suivants le sont dans la proportion d'un tiers. Les ménages relevant des deux derniers types de risques sont traités dans la proportion d'un ménage sur quatre.

La permutation étant, le cas échéant, réalisée sur des ménages, le nombre de personnes des ménages (variable IND) peut être légèrement affecté par cette opération. Les écarts restent toutefois très limités (moins de 3 individus dans 90 % des carreaux).

Les variables diffusées

Liste des variables

  • ID - Identifiant de carreau de forme NyyyyyyExxxxxx (1)
  • IDinspire - Identifiant de carreau de forme CRS3035RES200mNyyyyyyExxxxxx (2)
  • IDL - Identifiant de carreau de forme LAEA200M_NyyyyyyExxxxxx
  • X_LAEA - Coordonnée géographique X du coin sud-ouest du carreau (coordonnées LAEA ETRS89)
  • Y_LAEA - Coordonnée géographique Y du coin sud-ouest du carreau (coordonnées LAEA ETRS89)
  • MenXYNE1 - Nombre de ménages dont les coordonnées sont moins précises que la parcelle (indicateur de qualité de la géolocalisation)
  • IND - Nombre d'individus des ménages
  • AGE1 - Nombre d'individus des ménages, âgés de 0 à 3 ans
  • AGE2 - Nombre d'individus des ménages, âgés de 4 à 5 ans
  • AGE3 - Nombre d'individus des ménages, âgés de 0 à 10 ans
  • AGE4 - Nombre d'individus des ménages, âgés de 0 à 14 ans
  • AGE5 - Nombre d'individus des ménages, âgés de 0 à 17 ans
  • AGE6 - Nombre d'individus des ménages, âgés de 25 ans et plus
  • AGE7 - Nombre d'individus des ménages, âgés de 65 ans et plus
  • AGE8 - Nombre d'individus des ménages, âgés de 75 ans et plus
  • MEN_1P - Nombre de ménages d'une personne
  • MEN_5P - Nombre de ménages de 5 personnes et plus
  • MEN_PROP - Nombre de ménages propriétaires
  • MEN_LOC - Nombre de ménages locataires (secteur privé ou secteur social)
  • MEN_OC5 - Nombre de ménages présents depuis 5 ans ou plus dans leur logement actuel
  • MEN_IND - Nombre de ménages en logement individuel
  • MEN_COL - Nombre de ménages en logement collectif
  • MEN_PAL - Nombre de ménages déclarant une résidence principale
  • MEN_AUT - Nombre de ménages déclarant une résidence secondaire
  • SUR - Surface cumulée des résidences principales, en mètres carrés
  • RFU_MED - Médiane du revenu fiscal par unité de consommation
  • UC_SUM - Unités de consommation
  • RFU_1 - Nombre de ménages dont le revenu fiscal se situe en dessous du seuil de bas revenu
  • RFU_2 - Nombre de ménages dont le revenu fiscal se situe au dessus du seuil de haut revenu

(1) Xxxxxx et yyyyyy : coorodonnées LAEA divisées par 2.

(2) CRS3035 pour la métropole, CRS4559 pour la Martinique et CRS2975 pour la Réunion.

Précisions sur les variables

L'âge des individus des ménages est calculé à partir des données de la déclaration de revenus, par différence entre l'année de naissance et l'année de revenus de la déclaration.

La nature des locaux (individuels ou collectifs) est établie à partir de la taxe d'habitation. La somme des ménages en logement individuel (MEN_IND) et des ménages en logement collectif (MEN_COL) peut être légèrement inférieure au nombre total de ménages. En effet, les autres types de logements (caravanes...), très peu nombreux, n'ont été inclus ni dans les logements collectifs ni dans les logements individuels.

La distinction entre résidence principale et résidence secondaire est établie à partir de la taxe d'habitation. Toutes les résidences non principales (MEN_AUT) sont assimilées à des résidences secondaires. La somme de MEN_AUT et MEN_PAL correspond donc bien au nombre total de ménages.

Le statut d'occupation du logement (locataires / propriétaire) est établi à partir de la taxe d'habitation. La somme de MEN_PROP et MEN_LOC correspond au nombre total de ménages.

La surface (SUR) est la surface totale en mètres carrés des logements occupés à titre de résidence principale, fournie par la taxe d'habitation.

Les variables de revenus :

Le revenu fiscal correspond à la somme des ressources déclarées par les contribuables sur la « déclaration des revenus » avant tout abattement et avant redistribution. Il ne peut pas être assimilé à un revenu disponible et ne permet donc pas de tirer de conclusions en termes de niveau de vie des ménages. Pour cela, il faudrait que l'on ajoute les revenus sociaux non déclarés (minima sociaux tels que RMI ou RSA et minimum vieillesse, prestations familiales, aides au logement) et que l'on soustraie les impôts directs (impôt sur le revenu et taxe d'habitation).

On interprétera donc avec prudence les inégalités de revenu fiscal constatées entre zones.

Le revenu fiscal par unité de consommation (UC) est le revenu du ménage rapporté au nombre d'unités de consommation qui le composent.

Par convention, le nombre d'unités de consommation d'un ménage fiscal est évalué de la manière suivante :

  • le premier adulte du ménage compte pour une unité de consommation ;
  • les autres personnes de 14 ans ou plus comptent chacune pour 0,5 ;
  • les enfants de moins de 14 ans comptent chacun pour 0,3.

Cette échelle d'équivalence est utilisée couramment par l'Insee et Eurostat pour étudier les revenus ainsi exprimés par « équivalent adulte ».

Trois indicateurs de revenus sont proposés dans les fichiers diffusés :

La médiane du revenu fiscal par unité de consommation (RFU_MED) : elle partage les personnes en deux groupes ; la moitié des personnes appartient à un ménage qui déclare un revenu par UC inférieur à cette valeur et l'autre moitié présente un revenu par UC supérieur. Cet indicateur permet donc de mesurer le niveau central des revenus par UC au sein d'une zone.

Le nombre de ménages dont le revenu fiscal par unité de consommation est inférieur au seuil de bas revenus : ce seuil de bas revenu est fixé par convention à 50 % du revenu médian par UC de la Métropole (résultats Métropole) ou du département (départements d'Outre-Mer). Pour la métropole, le revenu médian par UC s'établit à 18 749 € ; le seuil de bas revenu est donc égal à 9 374,5 € par UC.

Le nombre de ménages dont le revenu fiscal par unité de consommation est supérieur au seuil de hauts revenus : ce seuil de hauts revenus est fixé par convention au troisième quartile du revenu par UC de la Métropole (résultats Métropole) ou du département (départements d'Outre-Mer). Pour la métropole, il s'établit à 26 789 € par UC.

Ces indicateurs sont des indicateurs relatifs pour faciliter les comparaisons entre zones ; ils ne correspondent pas à des indicateurs de pauvreté. S'agissant de revenus avant redistribution ils ne constituent pas non plus des indicateurs de niveau de vie.

Précautions d'utilisation

Un certain nombre de précautions sont cependant à respecter lors de l'utilisation de ces données.

La brique de base pour la construction des données est le carreau mais il convient de ne pas faire d'analyse à ce niveau, du fait des opérations de permutation et d'imputation. Les données ne décrivent pas la situation « exacte » carreau par carreau. Mais elles reproduisent la situation exacte sur un sous-ensemble suffisamment large (de l'ordre de l'IRIS en zone urbaine, de l'ordre du canton en zone rurale).

Tous les carreaux sont difffusés, sans aucun seuil de nombre de ménages, ce qui implique une grande vigilance, en particulier lors d'analyses sur des zones peu denses. La moitié des carreaux de métropole contiennent 2 ménages ou moins et la moitié contiennent 6 personnes ou moins (voir tableau).

En zone urbaine, du fait des fortes densités, on peut considérer que les données sont fiables sur un ensemble relativement réduit de carreaux. En zone rurale, en revanche, il est recommandé de ne pas travailler à un niveau en deça de la taille d'un canton et de lisser les données.

Toute évolution temporelle serait non significative. Il ne faut donc faire aucune analyse en évolution entre les données de population issues de RFL 2009, précédemment diffusées, et les données RFL 2010 faisant l'objet de la présente diffusion.

Il ne faut en aucun cas comparer la somme de la population des carreaux composant une commune à la population de la commune au recensement de la population. Ces deux effectifs seront nécessairement différents, d'une part du fait de la différence de source (voir « Source des données ») et d'autre part du fait des opérations de « floutage ».

Nombre de ménages et nombre de personnes par carreau de 200m (France Métropole)
Quantile Nombre de ménages Nombre de personnes
La France métropolitaine compte 2 124 917 carreaux peuplés de 200 m de côté (estimations carroyées 2010).
1%
10%
25% Q1
Médiane
75% Q3 20 
90% 25  60 
99% 165  351 
Maximum 5 481  13 517 
Moyenne 12  28