Description des fichiers
Liste des fichiers disponibles
Ce fichier détail s’articule autour de 4 fichiers de données
- 3 fichiers de données sont proposés au format Beyond ;
- 1 fichier de données (scindé en 3 tables en raison du nombre important de variables) au format dBase.
Tableau récapitulatif des fichiers
Intitulé du fichier |
Nom du fichier |
Nombre d'observations |
Nombre de variables |
Taille non compactée (Mo) |
Taille du zip compacté (octets) |
| Format Beyond (ivx + ivd) |
| Individus tous rangs d’interrogation |
EEI11 |
420 451 |
489 |
142 Mo |
39 839 865 |
| Individus en 1ère interrogation |
EEI11_1 |
68 897 |
537 |
25,8 Mo |
8 524 622 |
| Individus en 1ère et 6ème interrogation |
EEI11_16 |
137 763 |
519 |
48,8 Mo |
14 693 460 |
| Format dBase (dbf) |
| Extrait 1 |
INDIV111 |
423 425 |
186 |
219 Mo |
80 420 197 |
| Extrait 2 |
INDIV112 |
423 425 |
186 |
271 Mo |
| Extrait 3 |
INDIV113 |
423 425 |
187 |
150 Mo |
Listes des variables par fichier :
Haut de page
Avertissement
Il vous sera très utile de vous référer à la liste
comparative des variables contenues dans les différents fichiers de données. Le type des variables y est précisé puisqu’il peut
varier selon que vous exploitez un fichier dBase ou Beyond. Cette liste est disponible au format Excel.
La différence entre le nombre d’observations du fichier individus (dBase, 423 425 obs.) et celui du fichier individus
tous rangs d’interrogation (Beyond, 420 451 obs.) s’explique par la prise en compte dans le fichier dBase des personnes ayant refusé
de répondre et qui habitent dans un logement où d’autres personnes ont répondu. Ces personnes ayant été affectées
d’un poids nul, les résultats obtenus par l’exploitation des deux fichiers seront donc identiques si vous utilisez la variable de pondération
EXTRI12 dans le fichier dBase.
Haut de page
Précisions sur les fichiers Beyond
- Les variables de pondération activées par défaut dans les fichiers EEI11_1, EEI11_16 et EEI11 sont
respectivement EXTRI112, EXTRI1612 et EXTRI12. Les résultats de l’exploitation
de ces fichiers sont exprimés en moyenne annuelle et varient d’un fichier à l’autre puisque la taille de l’échantillon
n’est pas la même.
- Le fichier EEI11 (individus tous rangs d’interrogation) est le fichier de référence. Les résultats obtenus avec ce
fichier sont les plus précis car l’échantillon sur lequel il s’appuie est plus important. N’utilisez les deux autres fichiers Beyond
que dans le cas où vous souhaitez tabuler des variables qui sont absentes de EEI11.
- La population totale obtenue à partir des 3 fichiers Beyond n’est pas strictement identique. Ces différences proviennent du fait que les coefficients
de pondération sont arrondis.
Haut de page
Précisions sur les fichiers dBase
- Compte-tenu de son nombre important de variables, le fichier individus a été scindé
en 3 tables dBase selon un découpage alphabétique des variables :
- la table indiv111.dbf contient les variables de AAC à EPAYS28 + IDENT + NOI + TRIM et les variables de pondération (EXTRI12 + EXTRI112 + EXTRI1612) ;
- la table indiv112.dbf contient les variables de EQPRC à NOIENF11 (y compris les variables IDENT + NOI et les variables de pondération EXTRI12 + EXTRI112 + EXTRI1612) + TRIM ;
- la table indiv113.dbf contient les variables NOIENF12 à ZUS (y compris la variable TRIM) + IDENT + NOI et les variables de pondération (EXTRI12 + EXTRI112 + EXTRI1612).
- Pour pouvoir croiser des variables appartenant à des fichiers différents, l’appariement des 3 fichiers de données dBase se fait à l’aide des
variables IDENT+NOI+TRIM, seul véritable identifiant d’un enregistrement. A cet effet, ces 3 variables sont présentes dans chacun
des 3 fichiers. Aussi, les 3 variables de pondération sont présentes dans les 3 fichiers ;
- Pour calculer des statistiques relatives à la population totale de la France métropolitaine à partir des données individuelles de
l’enquête, il faut pondérer celles-ci par le poids individuel. Pour une personne donnée de l’échantillon, le poids individuel
correspond au nombre de personnes de la population totale que représente cette personne.
- Le poids redressé (obtenu après correction de la non-réponse et calage sur la structure de la population de la France métropolitaine par sexe et âge quinquennal) est
donné par la variable EXTRI12 ;
- Pour les variables qui ne sont posées qu’en première interrogation (modules Situation un an auparavant et Calendrier rétrospectif) il faut pondérer
les réponses par la variable EXTRI112, et filtrer sur RGA=1 ;
- Pour les variables qui ne sont posées qu’en première et dernière interrogations (modules Revenus et Allocations) il faut pondérer par la variable
EXTRI1612, et filtrer sur RGA=1 ou 6.
- Les résultats de l’exploitation du fichier détail sont exprimés
en moyenne annuelle.
Haut de page