Système d'information sur les nouvelles entreprises 2018
Sine 2018
Sine 2018
Traitement statistique
Données sources
Les données sont collectées par le biais d’une enquête.
Fréquence de collecte des données
Pluriannuelle
Collecte des données
SINE est un système permanent d'observation et de suivi d'une génération (ou cohorte) de nouvelles entreprises tous les quatre ans.
Une génération correspond ici aux entreprises créées au cours de la même période (le premier semestre) d'une année donnée. Chaque génération d'entreprises est donc représentée par les seules créations du premier semestre de l'année.
Pour chaque génération, le recueil d'information repose sur trois interrogations :
-
la première, quelques mois après la création de l'entreprise ;
-
la deuxième, au bout de la troisième année d'existence de l'entreprise ;
-
la troisième, cinq ans après la création.
La collecte a été réalisée par le biais d’un questionnaire papierdont les données sont ensuite saisies par un prestataire externe pour la première interrogation . A partir de la deuxième interrogation, l’enquête se fait en ligne ; le questionnaire est toute fois disponible en version papier pour les entreprises qui en font la demande. Dans ce cas, la numérisation est assurée par l’établissement de Nancy.
Période de collecte
Novembre 2018 à avril 2019 (vague 1)
Novembre 2021 à avril 2022 (vague 2)
Novembre 2023 à avril 2024 (vague 3)
Mode de collecte
- Par voie postale
- Par Internet
Unité(s) enquêtée(s)
Unité légale
Plan de sondage
Toutes les nouvelles entreprises ne sont pas enquêtées.
Les échantillons de la cohorte 2018 du dispositif Sine sont tirés à partir des créations d'entreprises enregistrées dans le répertoire Sirene au cours du premier semestre 2018, réparties en strates selon les critères suivants :
-
la catégorie juridique, le secteur d'activité et la région, pour le questionnaire auprès des créateurs hors micro-entrepreneurs ;
-
le secteur d'activité et la région pour le questionnaire auprès des micro-entrepreneurs.
Le mode de tirage de l'échantillon permet une eprésentativité nationale et régionale des résultats.
Seules les entreprises survivantes sont ensuite réinterrogées après trois ans et cinq ans d'existence.
L'échantillon total Sine 2018 (première interrogation de la génération 2018) compte environ 24 000 créateurs hors micro -entrepreneurs , et 56 000 micro-entrepreneurs.
La deuxième interrogation de cette cohorte a eu lieu en 2021 et la troisième en 2023.
L’échantillon couvre la France entière, DOM compris.
Par souci d'allègement de la charge statistique pesant sur les entreprises, celles sélectionnées pour cette enquête ne sont pas interrogées dans le cadre de l'enquête sectorielle annuelle (ESA).
Taille de l'échantillon
80 000 unités
Documents de collecte
- Questionnaire d'enquête auprès des entreprises créées en 2018 : situation initiale (pdf, fr, 130 Ko, 12/07/0006)
- Questionnaire d'enquête auprès des micro-entrepreneurs créés en 2018 : situation initiale (pdf, fr, 157 Ko, 12/07/0006)
- Questionnaire d'enquête auprès des entreprises créées en 2018 - situation en 2021 (pdf, fr, 444 Ko, 04/10/2021)
- Questionnaire d'enquête auprès des micro-entrepreneurs créés en 2018 : situation en 2021 (pdf, fr, 366 Ko, 07/10/2021)
- Questionnaire d'enquête auprès des entreprises créées en 2018 - situation en 2023 (pdf, fr, 700 Ko, 03/10/2023)
- Questionnaire d'enquête auprès des micro-entrepreneurs créés en 2018 - situation en 2023 (pdf, fr, 579 Ko, 03/10/2023)
Validation des données
Les entreprises non-répondantes font l’objet de relances.
Les données brutes sont apurées et redressées selon les méthodes décrites infra.
Élaboration des données
La non-réponse partielle fait l’objet d’imputations : correction des données par cold-deck (sur l’emploi à partir de la source EPURE, sur les chiffres d’affaire à partir de la source ESANE) ou hot-deck (imputation des autres réponses au questionnaire par donneur/receveur).
La non-réponse totale est redressée par imputation, en deux temps : imputation du statut d'activité (active ou cessée) à l'aide d'un modèle du statut d'activité, puis imputation à l'aide d'un modèle de la non-réponse. Des repondérations successives conduiraient à l'issue des trois interrogations de la cohorte à avoir trois jeux de poids dans le fichier final, un pour chaque interrogation. Ceci poserait alors des problèmes difficiles à résoudre pour le croisement de plusieurs variables de vagues différentes.
Ajustement
sans objet
Correction des variations saisonnières
sans objet