Les réseaux de neurones appliqués à la statistique publique : méthodes et cas d’usages

Damien Babet (Insee-Dese, Département des études économiques), Quentin Deltour (Ensae au moment de l’étude ; Autorité de la concurrence), Thomas Faria (Insee-Dmcsi, SSP Lab), Stéphanie Himpens (Insee-Dmcsi, SSP Lab ; Banque de France)

Documents de travail
No M2023/01
Paru le :Paru le16/02/2023
Damien Babet (Insee-Dese, Département des études économiques), Quentin Deltour (Ensae au moment de l’étude ; Autorité de la concurrence), Thomas Faria (Insee-Dmcsi, SSP Lab), Stéphanie Himpens (Insee-Dmcsi, SSP Lab ; Banque de France)
Documents de travail No M2023/01- Février 2023

Les réseaux de neurones peuvent avoir des applications utiles pour la statistique publique. Ce document propose une introduction rapide aux réseaux de neurones, de leurs fondements théoriques jusqu’à leur mise en oeuvre pratique en R et python sur des problématiques spécifiques de statistique publique. Nous en illustrons les possibilités et les limites à travers trois cas d’usage détaillés : 1. l’imputation de valeurs manquantes dans une enquête, une activité importante en statistique et pour laquelle la performance prédictive est centrale. 2. L’exploitation de fichiers d’images, élargissant ainsi les possibilités d’utilisation des images comme des données statistiques. 3. La réduction de dimension qui permet de synthétiser des fichiers de données et ouvre la voie à de nombreuses applications. Ce document s’accompagne des codes permettant de mettre en oeuvre les méthodes présentées.