Utilisation des formats de diffusion

Méthodes
Dernière mise à jour le : 09/11/2016

Formats

Les formats des données téléchargeables sur le site de l’Insee sont, selon les sources, de type TXT, CSV, XLS, SDMX (XML), dBase ou Beyond 20/20.

Nous proposons également des données modélisées selon le standard RDF du web sémantique ainsi qu'un espace de nom XML

Les produits disponibles sont les suivants :

  • les populations légales du recensement de la population
  • des nomenclatures : le code officiel géographique (COG), la nomenclature d'activités (NAF), la nomenclature des professions et catégories socioprofessionnelles (PCS) et la nomenclature des catégories juridiques (CJ).

Données au formats RDF

L'Insee publie dans cette section des données modélisées selon le standard RDF du web sémantique. Cette formalisation facilite l'utilisation automatique des données par les applications compatibles avec ces nouvelles technologies. Pour plus d'information sur le web sémantique, on pourra consulter le site du W3C.

Les données suivantes sont disponibles :

  • Données géographiques : données issues du Code officiel géographique (COG) concernant les régions, les départements, les arrondissements, les cantons et les communes.
  • Codes et nomenclatures : nomenclature d'activités française (NAF), nomenclature des professions et catégories professionnelles (PCS).
  • Données de population : populations légales issues du Recensement.

D'autres données seront publiées dans les prochains mois.

Toutes les données RDF peuvent être interrogées dynamiquement grâce au langage d'interrogation SPARQL. Le point d'entrée SPARQL se trouve à l'adresse http://rdf.insee.fr/sparql.

L'espace de noms XML

Cet espace présente une bibliothèque de types, d'éléments et d'attributs permettant de représenter les données d'identification de base manipulées par l'Insee et ses partenaires. Les types peuvent être utilisés dans les schémas d'applications XML pour représenter ces données sous forme d'éléments ou d'attributs portant des noms quelconques et appartenant à n'importe quel espace de noms et les éléments et attributs peuvent être directement inclus dans n'importe quel document XML.

La description de ces données de base a été scindée en plusieurs modules indépendants décrivant des domaines fonctionnels spécifiques (identification des sociétés, des personnes physiques, des catégories d'activité, des catégories juridiques et des lieux géographiques). Un module commun comporte quelques définitions de base auxquelles font appel les modules spécialisés.