Description des fichiers
Liste des fichiers disponibles
Ce fichier détail s’articule autour de 4 fichiers de données
- 3 fichiers de données sont proposés au format Beyond ;
- 1 fichier de données (scindé en 3 tables en raison du nombre important de variables) au format dBase.
| Intitulé du fichier |
Nom du fichier |
Nombre d’observations |
Nombre de variables |
Taille non compactée (Mo) |
Taille du zip compacté (octets) |
| Format Beyond (ivx+ivd) |
| Individus tous rangs d’interrogation |
EEI2007 |
285 405 |
482 |
91 Mo |
26 210 820 |
| Individus en 1ère interrogation |
EEI2007_1 |
46 684 |
530 |
18 Mo |
5 932 877 |
| Individus en 1ère et 6ème interrogation |
EEI2007_16 |
92 953 |
513 |
33,5 Mo |
9 936 666 |
| Format dBase (dbf) |
| Extrait 1 |
INDIV20071 |
287 250 |
183 |
150 Mo |
52 757 699 |
| Extrait 2 |
INDIV20072 |
287 250 |
183 |
180 Mo |
| Extrait 3 |
INDIV20073 |
287 250 |
187 |
104 Mo |
Listes des variables par fichier :
Avertissement
Il vous sera très utile de vous référer à la liste
comparative des variables contenues dans les différents fichiers de données. Le type des variables y est précisé puisqu’il peut varier
selon que vous exploitez un fichier dBase ou Beyond. Cette liste est disponible au format Excel.
La différence entre le nombre d’observations du fichier individus (dBase, 287 250 obs.) et celui du fichier individus
tous rangs d’interrogation (Beyond, 285 405 obs.) s’explique par la prise en compte dans le fichier dBase des personnes ayant refusé
de répondre et qui habitent dans un logement où d’autres personnes ont répondu. Ces personnes ayant été affectées
d’un poids nul, les résultats obtenus par l’exploitation des deux fichiers seront donc identiques si vous utilisez la variable de
pondération EXTRI dans le fichier dBase.
Haut de page
Précisions sur les fichiers Beyond
- Les variables de pondération activées par défaut dans
les fichiers EEI2007_1, EEI2007_16 et EEI2007 sont respectivement EXTRI1, EXTRI16
et EXTRI. Les résultats de l’exploitation de ces fichiers sont exprimés en moyenne annuelle et varient d’un fichier
à l’autre puisque la taille de l’échantillon n’est pas la même.
- Le fichier EEI2007 (individus tous rangs d’interrogation) est le fichier de référence.
Les résultats obtenus avec ce fichier sont les plus précis car l’échantillon sur lequel il s’appuie est plus important.
N’utilisez les deux autres fichiers Beyond que dans le cas où vous souhaitez tabuler des variables qui sont absentes de EEI2007.
- La population totale obtenue à partir des 3 fichiers Beyond n’est pas strictement identique. Ces différences proviennent du fait que les
coefficients de pondération sont arrondis.
Haut de page
Précisions sur les fichiers dBase
- Compte-tenu de son nombre important de variables, le fichier individus a été scindé
en 3 tables dBase selon un découpage alphabétique des variables :
- la table indiv20071.dbf contient les variables de AAC à ENBSAB + IDENT + NOI + TRIM et les variables de pondération (EXTRI + EXTRI1 + EXTRI16)
- la table indiv20072.dbf contient les variables de ENCADR à NOI + TRIM
- la table indiv20073.dbf contient les variables de NOICON à ZUS + IDENT + NOI et les variables de pondération (EXTRI + EXTRI1 + EXTRI16)
- Pour pouvoir croiser des variables appartenant à des fichiers différents, l’appariement des 3 fichiers de données dBase se fait à l’aide des
variables IDENT+NOI+TRIM, seul véritable identifiant d’un enregistrement. A cet effet, ces 3 variables sont présentes dans chacun
des 3 fichiers. Aussi, les 3 variables de pondération sont présentes dans les 3 fichiers.
- Pour calculer des statistiques relatives à la population totale de la France métropolitaine à partir des données individuelles de
l’enquête, il faut pondérer celles-ci par le poids individuel. Pour une personne donnée de l’échantillon, le poids individuel
correspond au nombre de personnes de la population totale que représente cette personne.
- Le poids redressé (obtenu après correction de la non-réponse et calage sur la structure de la population de la France métropolitaine par sexe et âge quinquennal) est donné par la variable EXTRI.
- Pour les variables qui ne sont posées qu’en première interrogation (modules Situation un an auparavant et Calendrier rétrospectif) il faut pondérer les réponses par la variable EXTRI1, et filtrer sur RGA=1.
- Pour les variables qui ne sont posées qu’en première et dernière interrogations (modules Revenus et Allocations) il faut pondérer par la variable EXTRI16, et filtrer sur RGA=1 ou 6.
- Les résultats de l’exploitation du fichier détail sont exprimés en moyenne annuelle.
Haut de page