Enquête sur le coût de la main-d'œuvre et la structure des salaires 2022 

Ecmoss 2022

Sources
Paru le :Paru le17/05/2024
Consulter

Traitement statistique

Fréquence de collecte des données

Annuelle

Collecte des données

Trois modes de collecte co-existent. Historiquement, les questionnaires sont adressés par voie postale aux établissements. Les grandes entreprises pour lesquelles plusieurs établissements sont interrogés peuvent fournir une réponse informatisée, via un fichier sous tableur. Enfin, depuis l'Ecmo 2016, le mode de collecte par Internet, via le portail de réponse aux enquêtes entreprises de l'Insee, est proposé à un sous-échantillon d'établissements pour lesquels le volet "salarié" du questionnaire qui leur adressé porte sur peu de salariés.

Période de collecte

La collecte de l'ESS 2022 a eu lieu de mai à décembre 2023.

Mode de collecte

  • Par voie postale
  • Par Internet

Unité(s) enquêtée(s)

Établissement

Plan de sondage

L'échantillon est sélectionné selon un plan de sondage à deux degrés, stratifié à chacun des degrés. On procède d'abord à un tirage d'établissements, puis à un tirage de salariés au sein de ces établissements. Le taux de sondage est d'environ 3,5 % pour le niveau établissement et de 0,9 % pour les salariés. La stratification retenue est élaborée afin d'optimiser la précision du principal indicateur (le salaire horaire) selon les principales ventilations requises réglementairement (par secteur d'activité, taille d'entreprise, région notamment).

Le tirage des établissements s'effectue dans la base "tous salariés" constituée à partir des déclarations sociales (DSN), croisée avec le répertoire Sirus. L'échantillon portant sur une année N est tiré dans les données au 31/12/N-1.

Les établissements enquêtés sont sollicités pour répondre à un questionnaire portant sur leur établissement et à des questionnaires portant sur des salariés identifiés (de 1 à 24 selon les cas). L'échantillon des salariés est différencié selon le statut (cadre/non cadre).

Les échantillons établissements d'Ecmoss font partie du processus de coordination négative entre les enquêtes entreprises à l'Insee.

Taille de l'échantillon

Environ 18 000 établissements sont interrogés pour 165 000 salariés

Documents de collecte

Les questionnaires de l'ESS 2022 sont fournis ci-après:

Validation des données

Les résultats sont analysés et comparés avec d'autres indicateurs diffusés par l'Insee notamment dans le cadre du rapport qualité envoyé à Eurostat.

Élaboration des données

Les tables envoyées à Eurostat utilisent toujours deux enquêtes annuelles successives. Elles s'appuient donc sur des observations enquêtées au titre de l'année d'enquête (N) ainsi que des observations enquêtées au titre de l'année d'avant (N-1). Les variables de rémunération observées l'année N-1 sont actualisées ("vieillies") pour être représentatives de l'année N.

Ajustement

Enrichissement avec les données administratives

A la fin de la collecte, le fichier des répondants est enrichi d'informations provenant de la base "tous salariés" (BTS) issue principalement des sources administratives (DSN). On récupère ainsi notamment l'activité de l'établissement, la profession du salarié, des éléments administratifs sur sa rémunération, le temps de travail rémunéré, etc. Cet enrichissement d'informations issues des sources administratives est central dans le processus de l'enquête, à la fois pour compléter les données d'enquête, mais aussi pour vérifier la cohérence entre information administrative et information issue de l'enquête et décider de redresser le cas échéant.

Détermination du champ

La phase d'enrichissement sert aussi à repérer les cas "hors champ", afin de les différencier des non-répondants. On identifie les établissements hors champ (principalement ceux cessés depuis la constitution de la base de sondage) et les salariés hors champ (soit appartenant aux établissements hors champ, soit étant partis de l'établissement depuis la constitution de la base de sondage).

Apurement et correction de la non-réponse

Pour les questionnaires "salariés" :

La Dares est responsable du redressement des questionnaires salariés. Les variables centrales de l'enquête (salaire brut et nombre d'heures rémunérées) sont contrôlées principalement à l'aide des données individuelles issues de la base "tous salariés" (BTS). Les grands principes des opérations de redressement sont les suivants :

  • La valeur collectée par le questionnaire est conservée même en cas d'incohérence avec la valeur de la BTS, dès lors que les réponses données aux différentes questions du questionnaire sont cohérentes entre elles ;

  • Lorsque sont détectées des valeurs aberrantes ou manquantes ou encore des incohérences internes ou avec les données de la BTS, certaines variables sont redressées par imputations déterministes avec les variables de la BTS, d'autres sont redressées par modélisation (imputation statistique). Quelle que soit la source (questionnaire ou enrichissement) les données de rémunération sont considérées comme plus fiables que les données portant sur les durées ; ce sont donc les durées qui sont modifiées en cas d'incohérence.

En aval de ces redressements, la Dares calcule un premier jeu de poids "salarié" corrigé de la non-réponse totale en réallouant les poids des unités non répondantes sur les répondantes appartenant à la même strate de tirage.

L'Insee effectue ensuite un second jeu de redressements sur les données des salariés, pour satisfaire aux contraintes imposées par Eurostat. Notamment, un traitement particulier est réalisé pour les salariés au forfait, pour lesquels Eurostat souhaite que soient fournies un nombre d'heures rémunérées.

Ce travail d'expertise permet d'obtenir pour chaque année d'enquête la base redressée non calée qui, après le calage effectué à l'Insee devient la base annuelle de diffusion nationale.

Pour les questionnaires "établissements" :

Le redressement des questionnaires "établissements" concerne particulièrement le format Ecmo où la partie établissement est essentielle pour répondre à Eurostat. On distingue tout d'abord les répondants selon leur niveau de réponse : ils peuvent en effet répondre parfois pour l'établissement ou pour l'entreprise lorsque l'information au niveau établissement n'est pas connue. La table établissements est ensuite apurée en éliminant les établissements pour lesquels on constate ou on considère une non-réponse totale. Sont considérées en non-réponse totale les établissements ne répondant pas à un bloc entier de variable ou à certaines variables dites "clés", comme celles portant sur les charges ou la masse salariale. Comme pour les questionnaires salariés, des premiers poids sont calculés, en réallouant les poids des unités non répondantes de manière homogène sur les unités répondantes appartenant à la même strate de tirage. Ensuite, les réponses manquantes ou mal renseignées aux questions autres que les questions "clés" et qui conduisent à classer l'établissement en non-réponse totale sont redressées par imputation, notamment par hot-deck.

Traitement des unités influentes

Un traitement des unités influentes est effectué, qui permet de contrôler l' "influence" d'individus qui, de par leur réponse et leur poids élevé - et sans que leur réponse ne soit erronée -- conduisent à des mesures certes toujours sans biais mais potentiellement bien moins précises des statistiques d'intérêt sur les domaines auxquels ils appartiennent. On applique pour cela une technique de winsorisation (méthode de Kokic et Bell) qui réduit le poids de l'individu influent sans pour autant perdre l'information de sa réponse. Cela permet d'améliorer la précision.

Calages sur marges
1. On cale pour chaque enquête annuelle les variables issues de l'enquête sur les marges de la population totale en emploi salarié issues de la BTS, selon de nombreux critères (catégorie sociale, sexe, localisation géographique, etc.).
2. Après concaténation des fichiers annuels pour le rendu Eurostat, on cale une deuxième fois l'ensemble sur les marges relatives à l'année de validité de l'enquête.
Chacun des calages sur marges est réalisé grâce à la procédure Calmar.

Rendu Eurostat

Les tables envoyées à Eurostat utilisent toujours deux enquêtes annuelles successives. Sur la base concaténée, des derniers redressements sont faits pour satisfaire aux contraintes imposées par Eurostat. Ces contraintes sont d'abord des bornes strictes pour plusieurs variables (temps de travail, valorisation des heures supplémentaires par exemple), ou l'absence de non-réponse partielle (suppression des individus dont certaines variables sont manquantes).