Lettre Sirene open data actualités n° 6  18 septembre 2019

Services
Dernière mise à jour le :18/09/2019

 La lettre Sirene open data actualités est une lettre d'information de l'Insee destinée aux utilisateurs des données Sirene.

Quoi de neuf ?

Catégories d’entreprises 2017

La mise à jour des catégories d'entreprises a eu lieu le 28 août 2019 dans l’API Sirene.

La variable categorieEntreprise a été mise à jour avec la valeur 2017, quand elle est connue. La variable anneeCategorieEntreprise a alors pris la valeur 2017.

7 millions d'unités légales et 12 millions d'établissements sont concernés.

Attention, cette mise à jour ne modifie pas les dates de dernier traitement des unités légales et des établissements (dateDernierTraitementUniteLegale et dateDernierTraitementEtablissement).

Comment récupérer les catégories d'entreprises mises à jour ?

Comme les dates de dernier traitement ne sont pas modifiées, il faut faire une requête spécifique pour récupérer ces informations.

1) Si vous utilisez les curseurs dans l'API Sirene, nous vous recommandons de passer les requêtes suivantes :

  • /siren?q=anneeCategorieEntreprise:2017&champs=siren,categorieEntreprise,anneeCategorieEntreprise&nombre=1000&curseur=* pour les unités légales (avec gestion des curseurs suivants) et de répercuter ensuite ces informations sur votre référentiel établissement ;
  • ou, si vous ne gérez pas de référentiel unité légale, vous pouvez faire la requête similaire sur les établissements /siret?q=anneeCategorieEntreprise:2017&champs=siret,categorieEntreprise,anneeCategorieEntreprise&nombre=1000&curseur=* (avec gestion des curseurs suivants) ;

2) si vous utilisez les sorties CSV, il sera nécessaire de séparer cette mise à jour en plusieurs requêtes pour les unités légales, pour ne pas dépasser les limites de cette sortie et de la répercuter sur les établissements.
Par exemple :

  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*0)&champs=siren,categorieEntreprise,anneeCategorieEntreprise
  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*1)&champs=siren,categorieEntreprise,anneeCategorieEntreprise
  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*2)&champs=siren,categorieEntreprise,anneeCategorieEntreprise
  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*3)&champs=siren,categorieEntreprise,anneeCategorieEntreprise
  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*4)&champs=siren,categorieEntreprise,anneeCategorieEntreprise
  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*5)&champs=siren,categorieEntreprise,anneeCategorieEntreprise
  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*6)&champs=siren,categorieEntreprise,anneeCategorieEntreprise
  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*7)&champs=siren,categorieEntreprise,anneeCategorieEntreprise
  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*8)&champs=siren,categorieEntreprise,anneeCategorieEntreprise
  • /siren?q=(anneeCategorieEntreprise:2017 AND siret:*9)&champs=siren,categorieEntreprise,anneeCategorieEntreprise

3) si vous utilisez sirene.fr pour constituer une liste des établissements mis à jour, il n'est pas possible de sélectionner ceux dont la catégorie d'entreprise a une valeur donnée, et le critère de date de mise à jour ne permet pas de repérer les établissements concernés. Il vous faudra donc sélectionner sur d'autres critères pour rester en dessous de la limite des 200 000 établissements ; nous ne recommandons pas du tout cette solution.

4) Le fichier StockUniteLegale du 1er septembre disponible sur la page Base Sirene des entreprises et de leurs établissements (SIREN, SIRET) contient les catégories d'entreprises actualisées avec les valeurs 2017.
Nous recommandons à ceux qui ne pourraient pas ou ne voudraient pas récupérer cette mise à jour par les moyens cités ci-dessus, de mettre leur référentiel à niveau par le fichier stock du mois de septembre.
À noter : recaler de temps en temps votre référentiel sur ces fichiers mensuels est une bonne pratique.

API Sirene : baisse prochaine des limites supérieures de nombre et debut

Le 1er octobre 2019, les valeurs limites supérieures des paramètres nombre et debut (actuellement à 10 000 pour nombre et 100 000 pour debut), seront abaissées dans l'API Sirene, pour les requêtes en json, afin de permettre d'assurer de meilleures performances de l’ensemble du dispositif pour l'ensemble des utilisateurs.

À cette date, la limite devient 1 000 pour nombre et 10 000 pour debut. Les requêtes utilisant des paramètres au-delà de ces valeurs seront exécutées avec ces valeurs maximales. Ces limites seront appliquées pour les unités légales, les établissements, les unités légales non diffusibles, les établissements non diffusibles et les liens de succession.

La pertinence d'une baisse de ces valeurs limites pour les requêtes en CSV est en cours d'instruction.

Si vos besoins dépassent ces valeurs (par exemple, pour récupérer les mises à jour quotidiennes), vous ne pourrez plus les obtenir en une seule fois : il faudra itérer jusqu'à récupérer toutes les valeurs.

Comme indiqué dans la documentation des services, la bonne pratique pour récupérer un nombre élevé d'éléments consiste à utiliser le paramètre curseur, ce qui signifie d'utiliser le format json.

Mode opératoire :

À votre première requête, ajoutez le paramètre curseur=*.

Le retour de la requête contiendra la variable CurseurSuivant qui donnera la valeur à attribuer au paramètre curseur pour obtenir la page suivante.

Quand la valeur de CurseurSuivant dans le résultat est la même que celle envoyée avec la requête (variable Curseur) il n’y a plus de résultat à récupérer.

Attention, certains utilisateurs qui n'étaient pas concernés par la limite de 30 requêtes/minute pourraient l'être. Le code d'erreur 429 correspond au dépassement du maximum de requêtes autorisées et devra, le cas échéant, être géré dans les applications clientes.

Exemple :

Vous avez mis à jour votre référentiel le mardi 3 septembre 2019 avec les mises à jour de la veille : votre référentiel a donc comme max(dateDernierTraitementUniteLegale) et max(dateDernierTraitementEtablissement) le 02/09/2019 22:20:25.
Le mercredi 04 septembre, vous pouvez vérifier avec le service informations qu'API Sirene a bien été mis à jour et que les dates de traitement maximum ont bien été modifiées. Ces deux variables sont passées au 03/09/2019 21:57:01.

Pour récupérer les valeurs modifiées des variables qui vous intéressent, vous passerez la requête suivante :

  • siret?q=dateDernierTraitementEtablissement:[2019-09-02T22:20:25 TO 2019-09-03T21:57:01] OR dateDernierTraitementUniteLegale:[2019-09-02T22:20:25 TO 2019-09-03T21:57:01]&curseur=*&nombre=100

    Retour :
    Nombre : 100,
    Curseur : "*" ,
    CurseurSuivant : "AoEuMDU2ODAwNjU5MDA4MTc="

Deuxième requête :

  • /siret?q=dateDernierTraitementEtablissement:[2019-09-02T22:20:25 TO 2019-09-03T21:57:01] OR dateDernierTraitementUniteLegale:[2019-09-02T22:20:25 TO 2019-09-03T21:57:01]&curseur=AoEuMDU2ODAwNjU5MDA4MTc=&nombre=100

    Retour :
    Nombre : 100,
    Curseur : "AoEuMDU2ODAwNjU5MDA4MTc=" ,
    CurseurSuivant : "AoEuMDYyMjAwOTc3MDAwMzE="

Requête suivante :

  • /siret?q=dateDernierTraitementEtablissement:[2019-09-02T22:20:25 TO 2019-09-03T21:57:01] OR dateDernierTraitementUniteLegale:[2019-09-02T22:20:25 TO 2019-09-03T21:57:01]&curseur=AoEuMDYyMjAwOTc3MDAwMzE=&nombre=100

    Retour :
    Nombre : 100,
    Curseur : "AoEuMDYyMjAwOTc3MDAwMzE=",
    CurseurSuivant : "AoEuMTgwMDM1MDI0MDA0MjE="

etc...

Zoom sur…

Listes sirene.fr : fin des dysfonctionnements

Le service de constitution de listes d’établissements du site sirene.fr a connu des dysfonctionnements pouvant produire des listes incomplètes. Le problème est à présent résolu.

Pour rappel : le site sirene.fr vous permet de créer en ligne, gratuitement et sans création de compte, des fichiers au format CSV comprenant jusqu’à 200 000 établissements selon vos critères de sélection : localisation, activité, catégorie juridique, effectif, date de création, date de mise à jour.

Prochainement

Un nouveau service accessible par l’API Sirene est en cours d’élaboration :

  • un service Refus d’immatriculation au RCS. Mise à disposition prévue (à la date de cette lettre) : 4e trimestre 2019.

Nous contacter