Aller au contenu

Aller au menu principal

Aller à la recherche

Liens transversaux haut

Description des fichiers

Liste des fichiers disponibles

Ce fichier détail s’articule autour de 4 fichiers de données

  • 3 fichiers de données sont proposés au format Beyond ;
  • 1 fichier de données (scindé en 3 tables en raison du nombre important de variables) au format dBase.
Intitulé du fichier Nom du fichier Nombre d’observations Nombre de variables Taille non compactée (Mo) Taille du zip compacté (octets)
Format Beyond (ivx+ivd)
Individus tous rangs d’interrogation EEI2007 285 405 482 91 Mo 26 210 820
Individus en 1ère interrogation EEI2007_1 46 684 530 18 Mo 5 932 877
Individus en 1ère et 6ème interrogation EEI2007_16 92 953 513 33,5 Mo 9 936 666
Format dBase (dbf)
Extrait 1 INDIV20071 287 250 183 150 Mo 52 757 699
Extrait 2 INDIV20072 287 250 183 180 Mo
Extrait 3 INDIV20073 287 250 187 104 Mo

Listes des variables par fichier :

Avertissement

Il vous sera très utile de vous référer à la liste comparative des variables contenues dans les différents fichiers de données. Le type des variables y est précisé puisqu’il peut varier selon que vous exploitez un fichier dBase ou Beyond. Cette liste est disponible au format Excel. 

La différence entre le nombre d’observations du fichier individus (dBase, 287 250 obs.) et celui du fichier individus tous rangs d’interrogation (Beyond, 285 405 obs.) s’explique par la prise en compte dans le fichier dBase des personnes ayant refusé de répondre et qui habitent dans un logement où d’autres personnes ont répondu. Ces personnes ayant été affectées d’un poids nul, les résultats obtenus par l’exploitation des deux fichiers seront donc identiques si vous utilisez la variable de pondération EXTRI dans le fichier dBase.

Haut de page

Précisions sur les fichiers Beyond

  • Les variables de pondération activées par défaut dans les fichiers EEI2007_1, EEI2007_16 et EEI2007 sont respectivement EXTRI1, EXTRI16 et EXTRI. Les résultats de l’exploitation de ces fichiers sont exprimés en moyenne annuelle et varient d’un fichier à l’autre puisque la taille de l’échantillon n’est pas la même.
  • Le fichier EEI2007 (individus tous rangs d’interrogation) est le fichier de référence. Les résultats obtenus avec ce fichier sont les plus précis car l’échantillon sur lequel il s’appuie est plus important. N’utilisez les deux autres fichiers Beyond que dans le cas où vous souhaitez tabuler des variables qui sont absentes de EEI2007.
  • La population totale obtenue à partir des 3 fichiers Beyond n’est pas strictement identique. Ces différences proviennent du fait que les coefficients de pondération sont arrondis.

Haut de page

Précisions sur les fichiers dBase

  • Compte-tenu de son nombre important de variables, le fichier individus a été scindé en 3 tables dBase selon un découpage alphabétique des variables :
    • la table indiv20071.dbf contient les variables de AAC à ENBSAB + IDENT + NOI + TRIM et les variables de pondération (EXTRI + EXTRI1 + EXTRI16)
    • la table indiv20072.dbf contient les variables de ENCADR à NOI + TRIM
    • la table indiv20073.dbf contient les variables de NOICON à ZUS + IDENT + NOI et les variables de pondération (EXTRI + EXTRI1 + EXTRI16)
  • Pour pouvoir croiser des variables appartenant à des fichiers différents, l’appariement des 3 fichiers de données dBase se fait à l’aide des variables IDENT+NOI+TRIM, seul véritable identifiant d’un enregistrement. A cet effet, ces 3 variables sont présentes dans chacun des 3 fichiers. Aussi, les 3 variables de pondération sont présentes dans les 3 fichiers.
  • Pour calculer des statistiques relatives à la population totale de la France métropolitaine à partir des données individuelles de l’enquête, il faut pondérer celles-ci par le poids individuel. Pour une personne donnée de l’échantillon, le poids individuel correspond au nombre de personnes de la population totale que représente cette personne.
    • Le poids redressé (obtenu après correction de la non-réponse et calage sur la structure de la population de la France métropolitaine par sexe et âge quinquennal) est donné par la variable EXTRI.
    • Pour les variables qui ne sont posées qu’en première interrogation (modules Situation un an auparavant et Calendrier rétrospectif) il faut pondérer les réponses par la variable EXTRI1, et filtrer sur RGA=1.
    • Pour les variables qui ne sont posées qu’en première et dernière interrogations (modules Revenus et Allocations) il faut pondérer par la variable EXTRI16, et filtrer sur RGA=1 ou 6.
  • Les résultats de l’exploitation du fichier détail sont exprimés en moyenne annuelle.

Haut de page