Courrier des statistiques N8 - 2022

Avec cette nouvelle édition, le Courrier des statistiques livre son huitième numéro. La revue se donne une fois de plus pour ambition d’aborder, avec une tonalité qui se veut pédagogique quelques grandes problématiques auxquelles se confronte la statistique publique.
Le Courrier s’arrête en ouverture de ce numéro 8 sur l’enquête TeO qui explore de manière singulière comment les origines des immigrés ou des enfants d’immigrés influent sur leurs trajectoires et conditions de vie. Le second article propose d’analyser l’univers des statistiques dédiées aux collectivités locales.
Les répertoires sont à l’honneur dans les cinq articles qui suivent. Après avoir défini les répertoires, ces « référentiels indispensables et pourtant méconnus » comme des systèmes d’information normalisés et vivants, les deux articles suivants nous font pénétrer dans les constellations mêlées du Répertoire national d’identification des personnes physiques (RNIPP) et du système national de gestion des identifiants (SNGI). Puis on quitte le domaine des individus pour s’intéresser aux entreprises, avec le répertoire d’unités statistiques Sirus, outil indispensable au statisticien d’entreprises. Enfin, le dernier article nous plonge dans une singularité de l’appareil statistique français à travers la présentation de la base permanente des équipements (BPE).

Courrier des statistiques
Paru le :Paru le29/11/2022
Ali Hachid, Responsable des répertoires statistiques Sirus et Citrus, division Infrastructures et répertoires statistiques, Insee, ali.hachid@insee.fr et Marie Leclair, Cheffe du département Répertoires, infrastructures et statistiques structurelles, Insee, marie.leclair@insee.fr
Courrier des statistiques- Novembre 2022
Consulter

Sirus, le répertoire d’entreprises au service du statisticien

Ali Hachid, Responsable des répertoires statistiques Sirus et Citrus, division Infrastructures et répertoires statistiques, Insee, ali.hachid@insee.fr et Marie Leclair, Cheffe du département Répertoires, infrastructures et statistiques structurelles, Insee, marie.leclair@insee.fr

Tout statisticien intéressé par la collecte et l’analyse de données économiques a besoin de s’appuyer sur un répertoire d’entreprises, par exemple pour constituer une base de sondage ou confronter ses données d’enquête ou administratives à des valeurs de référence. En France, depuis plus de cinquante ans, la statistique publique s’est appuyée sur le répertoire Sirene géré par l’Insee pour produire de l’information économique. Conçu pour répondre à des besoins administratifs, Sirene ne permet pas de satisfaire pleinement les attentes du statisticien d’entreprise d’autant plus qu’il n’est pas souhaitable d’en alourdir la charge de gestion.

À partir de 2008, l’Insee a choisi de développer un répertoire statistique d’entreprises : Sirus, répertoire des unités statistiques, est adossé à Sirene et répond aux exigences du statisticien : il prend en compte la notion d’entreprise au sens économique, il intègre de nouvelles unités comme les groupes de sociétés, il met en œuvre des traitements spécifiques comme la cessation statistique. L’ambition est de doter le système statistique public d’un outil partagé, servant de référence à l’ensemble des productions. L’enjeu est également de renforcer la cohérence d’ensemble des statistiques diffusées dans le domaine économique.

Une question centrale pour le statisticien est de savoir si la statistique qu’il produit représente bien la population qu’il souhaite couvrir. Pour cela, il a besoin de données de référence, qui décrivent cette population couverte et auxquelles il confronte ses propres données. Les répertoires jouent ce rôle en recensant l’ensemble des unités statistiques d’intérêt.

Pour la production des statistiques d’entreprise, le répertoire inter-administratif Sirene a longtemps été la référence en France (https://www.insee.fr/fr/information/1972043). À partir de 2008, un répertoire complémentaire dédié spécifiquement aux usages des statisticiens publics est entré dans le paysage : Sirus (Système d’immatriculation au répertoire des unités statistiques) a, de ce fait, un champ et des unités d’observation différents de Sirene. Référentiel pour la statistique d’entreprise, il centralise de nombreuses informations provenant de différents processus statistiques. Il offre une large palette de services, aux responsables d’enquêtes comme aux systèmes d’information utilisateurs.

Répertorier les entreprises pour produire des statistiques représentatives

Recueillir une information via un questionnaire adapté, redresser la non‑réponse ou ventiler ses statistiques selon des critères variés ne sera pas pertinent si la population sur laquelle ces statistiques sont calculées est trop particulière pour qu’on en tire une quelconque généralité. Pour éviter cet écueil, le responsable d’enquête tire aléatoirement un échantillon dans une base de sondage. Celle-ci doit comprendre l’ensemble des unités d’intérêt pour l’enquête : ce sera, par exemple, l’ensemble des unités ayant une activité industrielle pour l’enquête annuelle de production (EAP) ou encore l’ensemble des entreprises créées un semestre donné pour le système d’information sur les nouvelles entreprises (Sine).

Si chaque enquête mobilise une base de sondage qui est fonction de son champ d’intérêt, il faut, pour la constituer, s’appuyer sur un référentiel recensant exhaustivement les unités statistiques : un répertoire.

Pour répondre au besoin de constitution de bases de sondage, le répertoire doit toutefois aller plus loin que le seul recensement des unités statistiques ; il est important de cumuler d’autres informations pour affiner le champ des bases de sondage à élaborer. Pour l’enquête annuelle de production citée précédemment, il est nécessaire par exemple de savoir quelles entreprises ont une activité industrielle et ce même si ce n’est pas leur activité principale ; pour le système d’information sur les nouvelles entreprises, il est fondamental de connaître la date de création de l’entreprise.

Les informations ainsi centralisées dans le répertoire peuvent être nombreuses : variables permettant de définir les entreprises productives marchandes (i.e. le champ de la statistique d’entreprises), mais également le statut juridique de l’entreprise, le secteur d’activité, la catégorie d’entreprise au sens de la , le secteur institutionnel, le statut marchand, productif, exploitant ou employeur, le chiffre d’affaires, les effectifs salariés, etc.

Ce recensement des unités statistiques est indispensable aux statistiques produites à partir d’enquêtes, mais pas seulement : cela est tout autant nécessaire pour produire une statistique sur les entreprises à partir de données administratives. Le champ des données administratives ne couvre que les unités sujettes à l’obligation administrative qui a généré la source, et il faut pouvoir le confronter à la population que l’on souhaite représenter : il s’agit alors de corriger, si nécessaire, les biais de couverture de la source administrative (Rivière, 2018). Par exemple, toutes les entreprises n’établissent pas de  ; c’est le cas des . De ce fait, toute statistique d’entreprise s’appuyant sur ces liasses fiscales doit être redressée pour prendre en compte le chiffre d’affaires de ces microentreprises.

Comment connaître exhaustivement la population des entreprises ?

Dans le cas français, le statisticien a l’opportunité de pouvoir s’appuyer sur le répertoire inter-administratif Sirene (Système informatique pour le répertoire des entreprises et des établissements) qui est géré par l’Insee depuis 1973 : chaque entreprise doit, selon le code du commerce, s’y immatriculer, signaler toute modification de sa situation (un changement d’adresse par exemple ou la création d’une nouvelle implantation). Une attention particulière est notamment apportée dans sa gestion pour éviter un doublon d’immatriculation. Depuis 1997, l’utilisation du numéro est obligatoire pour toutes les déclarations administratives et les formalités des entreprises, ce qui garantit la couverture du répertoire mais également sa mise à jour et la justesse des informations. Le champ de Sirene est même plus large que celui de la statistique d’entreprise c’est-à-dire l’ensemble des entreprises ayant une de biens ou de services : depuis 1983, les entreprises publiques mais aussi les administrations doivent s’immatriculer au répertoire Sirene. Les associations, lorsqu’elles sont employeuses, qu’elles demandent des aides ou paient des impôts, sont également enregistrées.

Ce répertoire Sirene est donc une ressource essentielle pour construire un répertoire à des fins statistiques. La plupart des pays peuvent s’adosser à un répertoire administratif, mais celui-ci est rarement géré par l’institut national statistique comme c’est le cas en France. Cette particularité permet de bien prendre en compte les besoins statistiques : la possibilité de mener des opérations d’amélioration de la qualité sur les adresses, de s’assurer de la bonne codification de l’activité, etc. En l’absence d’un tel répertoire comme base de départ, il faut entreprendre un travail conséquent pour initialiser un répertoire statistique d’entreprises : l’appariement et la synthèse de différentes sources administratives permet par confrontation d’essayer de dépasser les limites de couverture de chaque source ; on peut également recenser les entreprises soit méthodiquement, comme un recensement de population, soit en moissonnant par exemple les sites web ou les annuaires privés (Ouvrir dans un nouvel ongletUnece, 2015).

Vers la création d’un répertoire statistique des entreprises

Grâce à sa fraîcheur et à sa couverture large, Sirene a longtemps été exploité par les statisticiens qui ont directement adossé leurs processus statistiques à ce répertoire.

Toutefois, utiliser le même répertoire pour des usages administratifs et statistiques pose plusieurs difficultés. La gestion d’un répertoire administratif n’est pas la même, en effet, que celle d’un répertoire statistique. Par exemple, il n’est pas possible de changer la valeur de la variable pour un usage statistique ; toute modification de Sirene peut en effet avoir des incidences légales pour l’entreprise et il importe d’être conforme à la déclaration de l’entreprise. Cependant, le statisticien pourra exclure une entreprise de sa base de sondage (notamment en cas de cessation d’activité) pour éviter à l’avenir toute réinterrogation inutile. Mais ceci serait bien sûr inenvisageable dans le cadre d’un répertoire administratif, compte tenu des conséquences pour l’entreprise en cas de cessation erronée.

De même, exiger de Sirene l’intégration de nouvelles variables à finalité statistique accroît sa charge de gestion et ajoute un flou sur le statut de ses variables statistiques et de leur usage. Prenons l’exemple du code d’activité principale exercée de l’entreprise () : . Pour autant, sa présence dans le répertoire Sirene en fait une information, publique, facilement mobilisable par tous, pour obtenir par exemple des aides ou des subventions, ouvrir des droits ou des obligations. De ce fait, cet usage « administratif » et ses conséquences pratiques amènent beaucoup d’entreprises à contester la codification par l’Insee de leur activité principale. Cette information demeure dans le répertoire inter-administratif Sirene, ainsi que la catégorie d’entreprise, autre variable statistique ; mais toutes deux montrent l’équilibre difficile à établir au quotidien lorsqu’on diffuse des variables statistiques au niveau individuel.

Du fait de ces difficultés, l’Insee a voulu dissocier les usages statistiques et administratifs des répertoires. Un répertoire statistique, Sirus, a été ainsi créé à partir de 2008 en sus du répertoire Sirene. La séparation se parachèvera avec le passage à Sirene 4 prévu en 2023, dont l’usage sera purement administratif (Alviset, 2020). Toutes les variables ayant une finalité statistique seront répertoriées dans Sirus, qui deviendra le point d’entrée pour tous les besoins statistiques ; a contrario, Sirus ne sert qu’aux besoins statistiques. C’est ainsi un outil interne au service statistique public qui n’a pas vocation à être diffusé à l’extérieur (encadré 1).

Encadré 1. Sirus, un large spectre de services pour les statisticiens du service statistique public

Le répertoire Sirus n’est accessible qu’au sein du service statistique public. Les différents besoins des statisticiens vis-à-vis d’un répertoire ont préalablement été recensés : Sirus offre ainsi une palette de services personnalisés, tenant compte du mode d’accès souhaité et du champ d’intérêt du client (par exemple les entreprises agricoles, les filiales de groupe, etc.). Ces différents services sont :

  • l’extraction des caractéristiques d’une liste d’unités : à partir de leur identifiant, la liste d’unités est enrichie d’informations (chiffre d’affaires, activité économique principale, statut d’activité, catégorie juridique, etc.) en valeur courante ou à une date de valeur précise ;
  • la constitution de référentiel et de base de sondage : pour les clients « premium* » ayant des besoins récurrents, le champ d’intérêt du client est codé directement dans le répertoire. Par exemple, il permet de fournir la liste complète des unités agricoles actives au moins un jour pendant une année donnée, accompagnées de leurs caractéristiques en fin d’année ;
  • un service de recherche dans le répertoire notamment en vue d’ identifier des entreprises ou des établissements à partir de leur dénomination ou de leur adresse d’implantation ;
  • un service d’abonnement personnalisé permettant à chaque application cliente de recevoir hebdomadairement l’ensemble des mises à jour au répertoire impactant les unités de leur champ d’intérêt ;
  • des web services inter-applicatifs permettant à des applications ou des processus clients de dialoguer de manière interactive avec le répertoire Sirus, par exemple pour récupérer à la volée des données sur une entreprise à afficher sur une interface métier ;
  • un service de mise à jour du répertoire permettant à chaque processus statistique de faire remonter une information sur une unité, comme une cessation observée dans le cadre de la collecte d’une enquête auprès d’une entreprise. Le répertoire Sirus joue alors le rôle de rediffuseur de l’information à l’ensemble du réseau des statisticiens d’entreprise ;
  • une interface web dédiée permettant aux statisticiens d’explorer le répertoire Sirus dans toutes ses dimensions : navigation dans la structure des groupes de société, consultation de l’historique des évènements affectant une entreprise, etc. ;
  • des bases de données archivées et mises à disposition des statisticiens 4 fois par an, offrant un instantané du répertoire, pour un usage en self à partir d’un logiciel de traitement statistique.

* Il s’agit des producteurs des enquêtes structurelles (Esane), du recensement de la population, de l’indice de chiffre d’affaires, du SSM Agriculture, etc.

Un champ de la statistique d’entreprise différent du répertoire Sirene

Deux autres raisons ont justifié la séparation entre répertoire administratif et répertoire statistique. La première est la volonté de mieux définir et contrôler le champ de la statistique d’entreprise. Du fait de son usage administratif, Sirene est très adhérent aux besoins d’identification d’unités concernées par le recouvrement de l’impôt ou des cotisations sociales.

Un certain nombre d’unités légales (voir ci-après) sont immatriculées pour remplir des obligations administratives sans pour autant avoir une réelle consistance économique (on peut par exemple citer les sociétés civiles de moyens pour la gestion de ressources partagées dans les professions libérales).

De ce fait, le champ utile de Sirus est plus restreint que celui de Sirene. On en exclut par exemple les associés gérants, les loueurs personnes physiques, les sociétés civiles de moyens précédemment citées, la majorité des sociétés civiles immobilières, les associations non employeuses, etc. Alors que Sirene comptabilisait en juillet 2020 plus de 14 millions d’unités légales actives, Sirus en dénombre environ 8,4 millions (figure 1).

Figure 1 - Le répertoire Sirus en chiffres

 


Le champ de Sirus est cependant un peu plus large que celui de la statistique d’entreprise : Sirus recense ainsi les unités employeuses, y compris quand elles sont non marchandes, y compris publiques ou associatives, etc. Ainsi parmi les 8,4 millions d’unités légales actives dans Sirus, un peu plus d’un million correspondent à des unités hors champ de la statistique d’entreprise, unités légales non marchandes et non productives.

Une unité légale n’est pas toujours une unité statistique

La seconde raison à l’origine de la création de Sirus est la définition de l’unité d’intérêt du répertoire: ce que recense Sirene n’est pas toujours ce qui intéresse le statisticien. En effet, Sirene immatricule des et leurs . Par exemple, une entreprise de vente de chaussures constituera une unité légale avec plusieurs établissements (ses différents magasins) qui seront tous enregistrés dans Sirene.

Or, cette unité légale, définie d’un point de vue juridique, n’est pas forcément la plus pertinente pour analyser la vie des entreprises, leurs décisions, leurs stratégies : avec le développement des groupes de sociétés, les unités légales détenues par d’autres peuvent perdre tout ou partie de leur autonomie de décision. Dans notre exemple précédent, imaginons que les magasins soient possédés par un groupe qui dispose également d’une centrale d’achat et d’une entité assurant la publicité de la marque : il sera plus intéressant pour comprendre les décisions économiques d’analyser ces unités légales (magasins, centrale d’achat et entreprise de publicité) toutes ensemble. Pour définir le contour de ce groupe de sociétés, on se fonde sur les liaisons financières entre les unités légales. Le groupe est une nouvelle unité statistique, mais il n’a pas de véritable existence juridique et on ne le trouvera pas de ce fait dans Sirene.

Documenter le lien entre « entreprises au sens économique » et unités légales

À cette notion de groupe (définie par les liaisons financières), les économistes et statisticiens ont ajouté la notion d’entreprise, au sens économique, définie comme «  ». En reprenant toujours notre exemple, imaginons que le groupe de vente de chaussures possède également, pour des raisons financières, des salles de sport mais gérées de manière complètement autonome des magasins de chaussures. Il sera plus intéressant d’un point de vue économique de considérer au sein du groupe d’une part l’entreprise en charge des ventes de chaussures (comprenant les magasins, la centrale d’achat et l’entreprise de publicité) et d’autre part une entreprise comprenant le réseau de salles de sport (encadré 2). Cette entreprise, au sens économique, est une convention : elle n’a pas de réalité juridique, mais du point de vue de l’économiste cette convention est la plus apte à décrire de manière pertinente les décisions de l’entreprise. D’un point de vue pratique, le contour de ces entreprises au sens économique est construit par les statisticiens à partir des groupes de société, en mobilisant des méthodes dites de profilage, manuelles ou automatiques (Haag, 2019).

Encadré 2. Sirene et Sirus : des unités en moins... et des unités en plus

 

En France, les statistiques structurelles d’entreprise sont construites depuis l’exercice 2017 à partir de l’entreprise au sens économique, et non plus des unités légales. Cette évolution a eu pour conséquence une réévaluation de certains agrégats économiques, comme la production car les flux monétaires sans réelle consistance économique entre unités légales du même groupe sont annulés (Chanteloup et Haag, 2019) : ainsi la prise en compte des entreprises conduit à une « baisse » d’environ 7 % du chiffre d’affaires total (les ventes au sein de l’entreprise ne sont plus comptabilisées avec le passage à la notion d’entreprise). De plus, la répartition sectorielle est modifiée en faveur de l’industrie, car les entreprises industrielles rassemblent en leur sein des unités légales industrielles, mais aussi du commerce et des services, activités « support » de l’activité principale industrielle de l’entreprise.

Par rapport au répertoire inter-administratif Sirene qui recense les unités légales, Sirus répertorie ainsi ces différentes unités statistiques et identifie les liens entre elles : les établissements d’une unité légale, les unités légales, les entreprises au sens économique, leur appartenance à un groupe.

Afin d’en faciliter la maniabilité et la maintenance, seules les informations couramment utilisées par le statisticien sont répertoriées dans Sirus, soit les principales caractéristiques des unités (date de création, activité principale, effectifs salariés, etc.) ainsi que les liens entre ces unités. Les informations plus détaillées doivent être recherchées ailleurs : un ainsi que des complètent Sirus.

Au-delà de la constitution de bases de sondage

Le recensement exhaustif des unités statistiques fait aujourd’hui de Sirus le répertoire de référence pour constituer des bases de sondage sur les entreprises. Mais la centralisation de toutes ces informations sur les entreprises permet d’autres usages de Sirus : on y calcule par exemple la notion de cessation statistique des entreprises.

Qu’une entreprise ne soit plus présente dans les sources administratives mobilisées par la mise à jour de Sirus est un indice qui laisse penser que l’entreprise a cessé son activité, de même si les données de cette entreprise n’ont pas été actualisées depuis un certain temps. Cette information est cruciale pour la précision des enquêtes qui utilisent Sirus : une telle entreprise, cessée statistiquement, ne répondra pas à une enquête. Elle ne devrait même pas donner lieu au redressement de sa non-réponse (par exemple à une extrapolation de son chiffre d’affaires à partir des entreprises répondantes). Identifier les cessations statistiques améliore la qualité des résultats d’enquête, et permet évidemment d’épargner des coûts de collecte inutiles.

La mise à jour des informations, en continu, dans Sirus en fait également la source privilégiée pour étudier la démographie d’entreprises : le nombre de créations, mais aussi les stocks et les cessations d’entreprises. Sirus est utilisé pour la (Insee, 2022). Ainsi, la démographie d’entreprise est désormais calculée en concept entreprise et bénéficie des traitements de cessation statistique. De plus cela permet d’avoir un champ cohérent avec les autres productions de la statistique d’entreprise.

En France, les données d’enquêtes et les données administratives se fondent presque toujours sur le numéro Siren ; il est ainsi aisé de les apparier pour en combiner les informations. Cependant, il existe encore de rares cas où cette information est indisponible (un exemple parmi d’autres est l’enquête sur le transport routier de marchandises, qui échantillonne des véhicules), voire erronée. Dans ce cas, il faut réussir à retrouver l’identité de l’entreprise (on dit aussi « sireniser » les informations), en se fondant sur les caractéristiques connues de l’entreprise dans la source mobilisée, comme la dénomination de l’entreprise ou son adresse d’implantation. Sirus, qui regroupe en son sein de nombreuses informations sur chaque entreprise, est l’outil idéal pour les identifier et restituer un ensemble large de données les caractérisant.

Enfin, un nouvel usage a été confié à Sirus : la mesure de la des entreprises. Sirus compile pour chaque entreprise concernée, les différentes enquêtes de la statistique publique qui l’ont interrogée ainsi que le temps qu’elle a passé à répondre ; la question est en effet obligatoire à la fin de chaque enquête, depuis la commission Warsmann sur l’allègement des démarches administratives pour les entreprises (Ouvrir dans un nouvel ongletAssemblée nationale, 2011). La charge statistique de réponse aux enquêtes pour les entreprises constitue une information précieuse si on veut coordonner négativement les échantillons, c’est-à-dire choisir, quand on tire ces échantillons, avec une probabilité plus élevée les entreprises pour lesquelles la charge est la plus faible. Elle permet de répartir la charge d’enquêtes entre entreprises de manière plus équitable.

Sirus, au centre de nombreux processus statistiques

Pour construire Sirus, on s’adosse au répertoire Sirene, dont on complète les informations par de nombreux autres processus statistiques, qui eux-mêmes se fondent sur Sirus (pour tirer des échantillons, identifier des unités, définir leur champ, etc.). Sirus est ainsi au cœur d’un système complexe.

En effet Sirus exploite les informations provenant de différentes sources administratives pour enrichir la connaissance de ses unités : les données sur la TVA, les liasses fiscales, les données sur l’emploi, les permettant de repérer les microentrepreneurs, les données des Douanes pour repérer les entreprises importatrices ou exportatrices (figure 2).

Figure 2 - Sirus, au cœur des systèmes d’information statistique

 


La centralisation de toutes ces informations permet en retour de pouvoir décrire finement les unités qui composent le répertoire et de s’assurer de leur complétude ; elle permet également de fournir un référentiel commun à l’ensemble des statistiques d’entreprise, ce qui est un enjeu pour que celles-ci, bien que produites à partir de processus différents, demeurent comparables. Se fondant toutes sur Sirus, la définition de l’activité, de la catégorie d’entreprise, de ce qui est dans ou hors du champ devrait être identique d’une enquête à l’autre.

Historisation des informations, cohérence interne : deux facteurs de complexité

Mais derrière cette ambition, il y a bien sûr des difficultés : Sirus est mis à jour en continu par différentes sources d’information. Ses évolutions reflètent tout à la fois une réalité économique (par exemple, en décembre 2021, l’ensemble des unités actives n’est pas le même qu’un an auparavant) mais aussi la disponibilité de l’information, parfois avec retard (la cessation d’une entreprise en décembre 2021 n’est connu qu’en mars 2022). Sirus historise ainsi l’information pour prendre en compte au cours du temps les changements qui interviennent réellement sur les unités statistiques mais aussi les mises à jour des sources : les modifications ont ainsi une date de traitement (ou une date de prise en compte dans le répertoire) et une date d’effet (ou de validité dans la réalité économique). Cependant, compte tenu du nombre de sources impliquées pour la mise à jour de Sirus (de l’ordre d’une dizaine), toutes les variables et tous les changements ne peuvent pas être historisés, de manière à conférer à Sirus une certaine maniabilité.

Une autre difficulté tient également à la cohérence interne du répertoire : certaines variables, comme la catégorie d’entreprise ou encore le champ de la statistique d’entreprise, sont calculées par Sirus sur la base des différentes informations que lui apporte chaque source. Les interdépendances entre variables du répertoire Sirus peuvent être telles qu’il n’est pas toujours aisé de répercuter une correction sur l’ensemble du processus. Dès lors, une correction peut créer un dilemme entre l’incohérence potentielle qu’elle peut créer au sein du répertoire et le souci d’exactitude et de fraîcheur (avoir la dernière information d’une source de données). Et il arrive que l’on soit contraint en dernier recours de restaurer la base à partir d’une version antérieure à la prise en compte d’une information erronée.

Enfin, toutes ces sources d’information peuvent modifier des unités pour une même caractéristique (une enquête structurelle annuelle peut modifier le code d’activité principale exercée alors que l’entreprise aura demandé au répertoire Sirene de modifier ce code pour une raison administrative). Dès lors, il convient d’arbitrer entre ces différentes mises à jour pour savoir à laquelle Sirus donne la préséance : faut-il choisir l’information la plus récente ? Ou considérer que certaines sources sont prioritaires sur certains champs ?

Pour gérer ces conflits , un ensemble de règles ont été établies visant pour chaque variable à déterminer la priorité de chaque source en fonction de la date d’effet proposée de la mise à jour (Sirene ne peut pas, par exemple, mettre à jour l’activité d’une entreprise pour l’année N si cette entreprise a été enquêtée la même année par une enquête annuelle structurelle).

Les enjeux sont importants car pour être utilisé, Sirus doit apporter à ses utilisateurs une information la plus fraîche possible, la plus riche mais aussi cohérente, facilement mobilisable et traçable (l’utilisateur voudra pouvoir retrouver la base de sondage tel qu’il l’aura défini à un instant T à partir de Sirus).

Des répertoires nationaux aux répertoires supranationaux

Bien que les business registers (répertoires d’entreprise) ne soient pas une « statistique » fournie par les instituts nationaux statistiques à Eurostat, ils font l’objet de beaucoup d’attentions dans les travaux européens et internationaux, compte tenu de leur rôle central dans la production de toutes les autres statistiques d’entreprise : manuels et groupes de travail visent à harmoniser et à améliorer la qualité de ces répertoires (Ouvrir dans un nouvel ongletUnece, 2015 ; Ouvrir dans un nouvel ongletEurostat, 2021).

Eurostat ou la commission statistique des Nations Unies incitent ainsi les instituts statistiques à réaliser des autoévaluations de la maturité de leur business register : la couverture de ces répertoires, en termes de , mais aussi d’unités statistiques est un élément de cette évaluation, ainsi que le nombre de sources prises en compte, la fréquence de leur mise à jour, leur cohérence interne et externe, le détail géographique, les supports légaux les fondant, leur (Ouvrir dans un nouvel ongletCollet et Iskrenova, 2021 ; Ouvrir dans un nouvel ongletAl Kafri et Hermans, 2021).

Si ces répertoires sont un enjeu au niveau européen et international, c’est aussi par ce que la pertinence de leur dimension nationale est remise en cause par la mondialisation (Ouvrir dans un nouvel ongletSturm, 2021). Par définition, les répertoires nationaux d’entreprise couvrent le territoire national : on trouve donc dans le répertoire français les unités légales françaises et ce que l’on appelle la « trace française » des groupes et des entreprises au sens économique. En effet, certaines entreprises sont transnationales et une partie des unités légales sur le territoire français peut appartenir à une entreprise dont le centre de décision se trouve à l’étranger. Dans ce cas, la statistique française, et les répertoires, ne suivent que la trace de l’entreprise qui se trouve sur le territoire français mais ne capte ainsi qu’une partie des choix économiques qu’opère l’entreprise.

Parce qu’il peut être plus pertinent pour comprendre et analyser les décisions de ces entreprises de se situer à un niveau supranational, un répertoire des groupes européens (European Group Register, EGR) est construit par les différents instituts nationaux statistiques européens sous l’égide d’Eurostat ; des tentatives similaires sont faites au niveau mondial par l’OCDE (Analytical Database on Individual Multinationals and Affiliates, Adima) et la commission statistique des Nations Unies (global enterprise group register), prenant en compte le poids considérable des entreprises multinationales dans l’économie mondiale (Ouvrir dans un nouvel ongletSnyder, Di Matteo, Pilgrim et Ostolaza, 2021).

Quelles évolutions à l’avenir pour Sirus ?

Le répertoire européen des groupes se construit en se fondant sur les répertoires nationaux et permet de définir les enveloppes des groupes européens. À terme, une interopérabilité sera exigée entre ces répertoires nationaux, dont Sirus, et le répertoire européen des groupes, c’est-à-dire que Sirus devra pouvoir marquer les groupes européens avec les identifiants du répertoire européen et assurer la cohérence des données des deux répertoires sur le champ des entreprises multinationales.

Ces évolutions sont prévues par le nouveau règlement européen sur les statistiques d’entreprise Structural Business Statistics (Colin, 2019) qui a également relevé le niveau d’exigence sur les business registers nationaux en termes de variables à couvrir (de manière obligatoire ou recommandée, comme le marquage des ) et a réaffirmé le rôle central de ces répertoires, véritable colonne vertébrale de la statistique d’entreprise, pour garantir la cohérence des données dans le temps, entre les États membres et entre les différents domaines (statistiques de court terme, statistiques structurelles d’entreprises, démographie d’entreprises, statistiques du commerce selon les caractéristiques des entreprises, etc.).

Poussé par ces règlements, Sirus devrait donc s’enrichir de nouvelles variables dans les années à venir : le numéro de TVA intracommunautaire, l’identifiant LEI (Legal Entity Identifier), l’identifiant des entreprises et des groupes du répertoire européen (EGR) afin de faciliter les appariements avec d’autres sources.

Un autre enjeu important pour Sirus est la refonte du répertoire inter-administratif Sirene auquel il est adossé : à partir de janvier 2023, l’écosystème des formalités d’entreprise va être profondément modifié avec l’arrivée d’un guichet unique d’entreprises qui va remplacer tous les centres de formalité d’entreprise et amener une dématérialisation complète de ces formalités. Le répertoire Sirene va être profondément refondu pour prendre en compte ce nouveau contexte (Alviset, 2020). L’enjeu pour Sirus est de continuer à produire les mêmes services alors que sa principale source sera grandement modifiée.

Fondements juridiques

La loi LME -article 51- publiée le 4 août 2008 et le décret 2008-1354 du 18 décembre 2008 « relatif aux critères permettant de déterminer la catégorie d’appartenance d’une entreprise pour les besoins de l’analyse statistique et économique ». Voir les références juridiques en fin d’article.

Une liasse fiscale est un ensemble de déclarations fiscales remises par les professionnels (commerçants, indépendants, professions libérales, au régime réel normal) ou les sociétés soumises à l’impôt sur les sociétés.

« L’attribution par [...] l’Insee, à des fins statistiques, d’un code caractérisant l’activité principale exercée (APE) en référence à la nomenclature d’activités ne saurait suffire à créer des droits ou des obligations en faveur ou à charge des unités concernées » (décret n° 2007-1888). Voir références juridiques en fin d’article.

Règlement européen 696/93 du 15 mars 1993, voir les références juridiques en fin d’article.

Le répertoire Lifi (liaisons financières).

Le répertoire Citrus (Coordination des informations et des traitements sur les restructurations d’unités statistiques).

Ces séries statistiques étaient déjà produites auparavant, mais à partir de Sirene.

La charge statistique correspond au temps total que consacrent les entreprises à répondre aux enquêtes du service statistique public.

Issues de l’obligation de déclarations du chiffre d’affaires aux Urssaf pour les microentrepreneurs.

Voir également l’article de Pascal Rivière dans ce même numéro.

Les SPE sont des entités légales sans réelle consistance économique, créées pour donner à leur propriétaire des avantages spécifiques fournis par la juridiction d’accueil.

Pour en savoir plus

AL KAFRI, Saleh et HERMANS, Hank, 2021. Ouvrir dans un nouvel ongletThe Maturity Model for Statistical Business Registers. In : 27th Meeting of the Wiesbaden Group on Business Registers. [en ligne]. 20-24th September 2021. Inegi, Mexico, Session n° 7. [Consulté le 2 septembre 2022].

ALVISET, Christophe, 2020. La troisième refonte du répertoire Sirene : trop ambitieuse ou pas assez. In : Courrier des statistiques. [en ligne]. 29 juin 2020. Insee, N° N4, pp. 101-121. [Consulté le 2 septembre 2022].

ASSEMBLÉE NATIONALE, 2011. Ouvrir dans un nouvel ongletRapport n° 3787 fait sur la proposition de loi n° 3706 de M. Jean-Luc Warsmann relative à la simplification du droit et à l’allègement des démarches administratives. [en ligne]. 5 octobre 2011. Tome I de M. Étienne Blanc. [Consulté le 2 septembre 2022].

CHANTELOUP, Guillaume et HAAG, Olivier, 2019. De la définition juridique à la définition économique de l’entreprise : méthode et mode d’emploi. In : Les entreprises en France. Édition 2019. [en ligne]. 3 décembre 2019. Insee Références, pp. 45-58. [Consulté le 2 septembre 2022].

COLIN, Christel, 2019. FRIBS : un nouveau cadre commun pour les statistiques d’entreprises européennes. In : Courrier des statistiques. [en ligne]. 19 décembre 2019. Insee. N° N3, pp. 110-124. [Consulté le 2 septembre 2022].

COLLET, Isabelle et ISKRENOVA, Iliyana, 2021. Ouvrir dans un nouvel ongletData-quality indicators for European statistical business registers. In : 27th Meeting of the Wiesbaden Group on Business Registers. [en ligne]. 20-24 septembre 2021. Inegi, Mexico, Session n° 7. [Consulté le 2 septembre 2022].

EUROSTAT, 2021. Ouvrir dans un nouvel ongletEuropean business statistics methodological manual for statistical business registers. [en ligne]. 16 février 2021. Manuals and Guidelines. [Consulté le 2 septembre 2022]. 2021 edition.

HAAG, Olivier, 2019. Le profilage à l’Insee : une identification plus pertinente des acteurs économiques. In : Courrier des statistiques. [en ligne]. 27 juin 2019. Insee. N° N2, pp. 86-102. [Consulté le 2 septembre 2022]

INSEE, 2022. Rebond des créations d’entreprises en juin 2022. [en ligne]. 19 juillet 2022. Informations Rapides n° 185. [Consulté le 2 septembre 2022].

RIVIÈRE, Pascal, 2018. Utiliser les déclarations administratives à des fins statistiques. In : Courrier des statistiques. [en ligne]. 6 décembre 2018. Insee. N° N1, pp. 14-24. [Consulté le 2 septembre 2022].

SCHUHL, Pierrette, 2018. Le Legal Entity Identifier - Contexte international et rôle de l’Insee. In : Courrier des statistiques. [en ligne]. 6 décembre 2018. Insee. N° N1, pp. 58-68. [Consulté le 14 septembre 2022].

SNYDER, Nancy, DI MATTEO, Ilaria, PILGRIM, Graham et OSTOLAZA, Rodolfo, 2021. Ouvrir dans un nouvel ongletFuture Improvements and Collaboration on the GGR and ADIMA. In : 27th Meeting of the Wiesbaden Group on Business Registers. [en ligne]. 20-24 septembre 2021. Inegi, Mexico, Session n° 6. [Consulté le 2 septembre 2022].

STURM, Roland, 2021. Ouvrir dans un nouvel ongletUnits unchanged or units unchained: How to react to globalisation from a statistical units’ perspective ? In : 27th Meeting of the Wiesbaden Group on Business Registers. [en ligne]. 20-24 septembre 2021. Inegi, Mexico, Session n° 6. [Consulté le 2 septembre 2022].

UNECE, 2015. Ouvrir dans un nouvel ongletData sources for SBR. In : Guidelines on statistical business register. [en ligne]. Juillet 2015. Chapitre n° 6. [Consulté le 2 septembre 2022].