Système d'information sur les nouvelles entreprises 2014
Sine 2014
Sine 2014
Traitement statistique
Données sources
Les données sont collectées par le biais d’une enquête.
Fréquence de collecte des données
Pluriannuelle
Collecte des données
Sine est un système permanent d'observation et de suivi d'une génération (ou cohorte) de nouvelles entreprises tous les quatre ans.
Une génération correspond ici aux entreprises créées au cours de la même période (le premier semestre) d'une année donnée. Chaque génération d'entreprises est donc représentée par les seules créations du premier semestre de l'année.
Pour chaque génération, le recueil d'information repose sur trois interrogations :
-
la première, quelques mois après la création de l'entreprise ;
-
la deuxième, au bout de la troisième année d'existence de l'entreprise ;
-
la troisième, cinq ans après la création.
La collecte est réalisée par le biais d’un questionnaire papier dont les données sont ensuite saisies par un prestataire externe.
Période de collecte
Novembre 2014 à avril 2015 (vague 1)
Novembre 2017 à avril 2018 (vague 2)
Novembre 2019 à avril 2020 (vague 3)
Mode de collecte
Par voie postale
Unité(s) enquêtée(s)
Unité légale
Plan de sondage
Toutes les nouvelles entreprises ne sont pas enquêtées.
Les échantillons de la cohorte 2014 du dispositif Sine sont tirés à partir des créations d'entreprises enregistrées dans le répertoire Sirene au cours du premier semestre 2014, réparties en strates selon les critères suivants :
-
la région, le secteur d'activité et l’emploi (création avec ou sans salariés) pour le questionnaire auprès des créateurs hors auto-entrepreneurs ;
-
la région et le secteur d'activité pour le questionnaire auprès des auto-entrepreneurs.
Le mode de tirage de l'échantillon permet une représentativité nationale et régionale des résultats.
Seules les entreprises survivantes sont ensuite réinterrogées après trois ans et cinq ans d'existence.
L'échantillon total Sine 2014 (première interrogation de la génération 2014) compte environ 45 500 créateurs hors auto-entrepreneurs (dont environ 5 500 au titre d’extensions régionales), et 40 000 auto-entrepreneurs.
La deuxième interrogation de cette cohorte a eu lieu en 2017 et la troisième en 2019.
L’échantillon couvre la France entière, DOM compris, sauf Mayotte.
Par souci d'allègement de la charge statistique pesant sur les entreprises, celles sélectionnées pour cette enquête ne sont pas interrogées dans le cadre de l'enquête sectorielle annuelle (ESA).
Taille de l'échantillon
80 000 unités
Documents de collecte
- Questionnaire d'enquête auprès des entreprises créées en 2014 - situation en 2017 (pdf, fr, 128 Ko, 11/07/0006)
- Questionnaire d'enquête auprès des entreprises créés en 2014 - situation initiale (pdf, fr, 88 Ko, 16/07/2015)
- Questionnaire d'enquête auprès des auto-entrepreneurs créés en 2014 - situation initiale (pdf, fr, 79 Ko, 16/07/2015)
- Questionnaire d'enquête auprès des auto-entrepreneurs créés en 2014 - situation en 2017 (pdf, fr, 135 Ko, 11/07/0006)
- Questionnaire d'enquête auprès des entreprises créées en 2014 - situation en 2019 (pdf, fr, 509 Ko, 13/07/0006)
- Questionnaire d'enquête auprès des auto-entrepreneurs créés en 2014 - situation en 2019 (pdf, fr, 400 Ko, 13/07/0006)
Validation des données
Les entreprises non-répondantes font l’objet de relances.
Les données brutes sont apurées et redressées selon les méthodes décrites infra.
Élaboration des données
La non-réponse partielle fait l’objet d’imputations : correction des données par cold-deck (sur l’emploi à partir de la source EPURE, sur les chiffres d’affaire à partir de la source ESANE) ou hot-deck (imputation des autres réponses au questionnaire par donneur/receveur).
La non-réponse totale est redressée par imputation, en deux temps : imputation du statut d'activité (active ou cessée) à l'aide d'un modèle du statut d'activité, puis imputation à l'aide d'un modèle de la non-réponse. Des
repondérations successives conduiraient à l'issue des trois interrogations de la cohorte à avoir trois jeux de poids dans le fichier final, un pour chaque interrogation. Ceci poserait alors des problèmes difficiles à résoudre pour le croisement de plusieurs variables de vagues différentes.
Ajustement
sans objet
Correction des variations saisonnières
sasn objet