Economie et Statistique / Economics and Statistics n° 509 - 2019 Big Data et statistiques - 2ème partie
Les Big Data dans l’indice des prix à la consommation
Comparaison des indices de prix des vêtements et des chaussures à partir de données de caisse et de données moissonnées sur le Web
Antonio G. Chessa et Robert Griffioen
Résumé
Pour collecter les prix des biens de consommation, les instituts de statistique envisagent le recours à des données moissonnées sur le Web comme une alternative possible aux données de caisse. Les données de transaction étant rares, il est naturel de questionner la pertinence des données du Web pour le calcul d’indices de prix. On propose ici de comparer les indices de prix obtenus à partir de données du Web ou de données de caisse pour des vêtements et chaussures vendus par un même magasin en ligne. Les prix constatés en caisse et moissonnés sur le Web sont souvent égaux, bien que ceux du Web soient légèrement supérieurs en moyenne. Le nombre de produits dont les prix sont moissonnés sur le Web est très corrélé au nombre de produits vendus. Compte tenu du taux de renouvellement élevé des articles dans le secteur de l’habillement, une méthode multilatérale (celle de Geary-Khamis) a été utilisée pour calculer les indices de prix. Pour 16 catégories de produits, les indices montrent de légers écarts globaux entre les deux sources de données : les indices en glissement annuel ne diffèrent que de 0.3 point de pourcentage au niveau de la nomenclature COICOP (vêtements pour hommes et pour femmes). Reste à savoir si ces résultats prometteurs pour les données moissonnées sur le Web se confirmeront pour d’autres points de vente.
Article (pdf, 1 Mo )
Citer cet article
Chessa, A. G. & Griffioen, R. (2019). Comparing Price Indices of Clothing and Footwear
for Scanner Data and Web Scraped Data. Economie et Statistique / Economics and Statistics, 509, 49–68.
https://doi.org/10.24187/ecostat.2019.509.1984