Données massives, statistique publique et mesure de l’économie

Didier Blanchet, Pauline Givord

La multiplication des traces numériques générées par l’activité des individus ou des entreprises ainsi que la capacité croissante à les stocker et à les analyser sont à l’origine du phénomène dit des « big data », traduit en français par « données massives » ou « mégadonnées ». S’appuyer sur de grandes quantités de données individuelles n’est évidemment pas une nouveauté pour la statistique publique, qui exploite à la fois des données d’enquêtes, de recensement et une grande variété de sources administratives.

Mais l’arrivée des big data introduit deux ruptures majeures, une volumétrie bien supérieure et un accès quasi immédiat. Tirer parti de ces avantages se heurte néanmoins à plusieurs obstacles, car ces données ne sont pas non plus sans défauts : elles sont de formats complexes et très variables, leur mobilisation peut nécessiter des investissements techniques coûteux, leur représentativité n’est pas toujours garantie, de même que leur pouvoir prédictif.

Ce dossier propose un point d’étape sur l’apport de ces données à trois aspects de la mesure de l’économie. Tout d’abord le suivi conjoncturel : l’analyse des comportements de recherche sur le web ou de la presse en ligne permet-elle de mieux anticiper le climat conjoncturel que ne le font les données d’enquête ? La réponse à cette question reste, à ce stade, assez réservée.

Le second domaine est celui du suivi des prix. L’apport des big data s’y avère d’ores et déjà bien plus tangible, qu’il s’agisse de prix collectés sur Internet ou des données de caisse transmises par les enseignes de distribution. On présentera enfin quelques tentatives de mobilisation des big data pour la quantification du phénomène dont elles sont l’une des manifestations, l’explosion du secteur de l’économie numérique.

Insee Références
Paru le :Paru le11/07/2017
Didier Blanchet, Pauline Givord
L'économie française - Comptes et dossiers- Juillet 2017