Courrier des statistiques N5 - 2020

Le numéro N5 ne pouvait ignorer le caractère spécifique de 2020 : il commence donc par un article du directeur général de l’Insee sur l’adaptation de l’institut, de ses méthodes, au contexte exceptionnel de la crise sanitaire. Le Courrier s’intéresse ensuite à des sujets structurants de gouvernance, à travers l’Autorité de la statistique publique, qui tire un bilan de dix années d’existence, et l’expérience récente du Comité du label de la statistique publique.

Comment produire des données utiles à la décision publique ? Avec une représentation cartographique d’une grande souplesse, le carroyage permet de mieux appréhender la réalité des territoires. Avec une communication adaptée, les indicateurs de valeur ajoutée des lycées répondent au besoin d’évaluation et de pilotage interne, comme aux attentes des citoyens et des médias. Avec un modèle de microsimulation dynamique sur les retraites, Prisme accompagne le législateur qui veut faire évoluer la réglementation.

Enfin, le dernier article soulève une question simple : qu’est-ce qu’une donnée ? Exploiter ce matériau constitue le cœur de métier du statisticien, mais en mesure-t-il bien toutes les dimensions ?

Courrier des statistiques
Paru le :Paru le31/12/2020
Bryan Bellanger et Samuel Goujon, chargés d’études statistiques, Caisse nationale d’assurance vieillesse (Cnav)
Courrier des statistiques- Décembre 2020
Consulter

Prisme Du régime général au régime universel, la microsimulation comme outil d’aide à la décision

Bryan Bellanger et Samuel Goujon, chargés d’études statistiques, Caisse nationale d’assurance vieillesse (Cnav)

En France, les nombreux régimes qui composent le système de retraite sont le fruit de sa singularité historique mais aussi les témoins de sa complexité. Ce système connaît régulièrement des évolutions législatives portées par les différentes réformes et décrets, impliquant la mobilisation de maints acteurs de la production statistique. Dans ce contexte, la Cnav – premier régime de retraite français – s’est dotée dès le début des années deux-mille d’un modèle de microsimulation dynamique nommé Prisme.
Contrairement à d’autres modèles, Prisme se distingue par son insertion au sein d’un régime, l’inscrivant dans un usage « métier ». Ainsi il porte un double objectif : de gestion et de prospective. Par ailleurs, Prisme bénéficie de données riches et uniques puisque qu’il s’appuie sur les bases de gestion de la Sécurité sociale.
L’architecture du modèle se décompose en modules construits au plus proche des trajectoires de vie des assurés : démographie, carrière, retraite. Si Prisme est techniquement complexe, pouvant projeter des scénarios à court terme comme à long terme (horizon 2070), sa malléabilité lui permet de s’adapter continuellement aux évolutions du système comme en témoigne l’intégration récente du régime des travailleurs indépendants.

Un système de retraites marqué par l’héritage historique

Le système de retraites français est le fruit d’une volonté postérieure à la deuxième guerre mondiale de construire un système d’assurance vieillesse capable de couvrir l’ensemble de la population. Il s’inscrit dans l’objectif d’offrir aux Français un large système de couverture sociale, permettant de se prémunir de tous les risques : santé, retraites, famille et accidents du travail. À ses débuts, l’existence de , doublée des réserves émises par les travailleurs indépendants, a orienté les choix vers un système de retraites par catégories socioprofessionnelles. Il en a résulté une pluralité de régimes, pour la plupart toujours existants, de dimensions bien différentes – allant de quelques centaines de bénéficiaires pour le régime du port autonome de Strasbourg ou celui de la Comédie-Française, à plusieurs millions pour le régime général qui regroupe les salariés du secteur privé. À cela s’ajoutent des réglementations disparates et des règles de calcul des pensions propres à chaque régime.

Depuis, les évolutions sociétales et en particulier les améliorations des conditions de travail, des conditions sanitaires combinées aux progrès de la médecine, ainsi que le vieillissement des générations nombreuses du « baby-boom » ont amené une part de plus en plus massive d’individus aux âges auxquels ils pouvaient non seulement prétendre à la retraite, mais aussi et surtout en bénéficier plus longtemps. Ce contexte de vieillissement de la population soulève des questions sur des enjeux majeurs : les financements, les dépenses et donc l’équilibre financier de ces régimes, pensés à une époque où la répartition entre le nombre de cotisants et les nombre de retraités était toute autre.

Plusieurs réformes réglementaires ont donc été menées ces 30 dernières années afin d’assurer la pérennité financière des régimes de retraite. En 2000, le Conseil d’orientation des retraites (COR) a été créé afin d’étudier, d’analyser et de suivre les perspectives à moyen et long terme de chaque régime, dans le but d’avoir une vision globale de l’ensemble du système de retraites. Ce conseil n’a pas qu’une vision prospective, son rôle est aussi de vérifier que les décisions réglementaires prises auparavant conduisent bien aux effets escomptés plusieurs années voire décennies plus tard.

Cette ambition de disposer d’une vision éclairée du devenir du système de retraites a motivé au sein de chaque régime, notamment auprès de ceux pour lesquels les enjeux financiers sont plus prépondérants, la création de nouveaux outils de projection. Ceux-ci doivent se montrer aussi souples que pratiques, aussi modulables que lisibles et en mesure de s’adapter aux éventuelles modifications à venir.

Parmi toute la palette d’outils envisageables, la microsimulation dynamique, malgré quelques limites, répond bien à ces attentes (Blanchet, 2020). À l’instar d’autres institutions sur des sujets voisins, comme l’Insee avec le modèle Destinie (Blanchet et alii, 2011), la avec TRAJECTOiRE (Cheloudko et Martin, 2020) ou la Direction générale du Trésor avec Aphrodite, la Caisse nationale d’assurance vieillesse (Cnav), en charge du régime général des salariés, a choisi de se doter d’un modèle de microsimulation dynamique appelé Prisme.

 

Prisme, un modèle pour se projeter à l’horizon 2070

Juste après la (encadré 1), et après avoir contribué aux chiffrages préalables à celle-ci, la Cnav a décidé de se munir d’un nouveau modèle de projection. Le projet était ambitieux. Le modèle devait servir à l’ensemble des travaux de prospective de la branche vieillesse de la Sécurité sociale : depuis des prévisions à l’année N pour la Commission des comptes de la Sécurité sociale (Ouvrir dans un nouvel ongletCCSS, 2020) et des prévisions quadriennales pour les projets de loi de financement de la Sécurité sociale, jusqu’aux projections à long terme pour l’analyse de l’évolution de notre système dans les 50 prochaines années, mais aussi et surtout la simulation des futures réformes afin d’aider les pouvoirs à élaborer ces dernières. Parallèlement, le modèle devait s’insérer dans la logique de gestion d’un organisme dont le cœur de métier est la retraite et être en mesure de représenter un appui à la détermination et la compréhension des charges prévisionnelles d’activité.

Il aura fallu un an et demi aux experts de la Cnav pour concevoir et développer une première version de ce modèle. Il est baptisé Prisme, pour « Projection des Retraites Individuelle, Simulations, Modélisation et Évaluations ». Au printemps 2005, Prisme fournit ses premières projections à l’horizon 2050 pour alimenter le rapport du Conseil d’orientation des retraites sur l’équilibre financier du système de retraite français. Depuis, Prisme continue chaque année d’alimenter les rapports du COR avec des projections étendues à l’horizon 2070 (Ouvrir dans un nouvel ongletCOR, 2020).

 

Encadré 1. Les principales réformes des retraites

 

 

Le choix de la microsimulation dynamique

Prisme est défini comme un modèle de microsimulation dynamique, par opposition aux modèles dits statiques. Les modèles statiques illustrent une situation ou un phénomène étudié à un instant t, de manière immuable et figée dans le temps. Or, quand il s’agit de réforme des retraites, les mesures mises en place s’évaluent bien souvent sur une période de plusieurs années, voire décennies, ou générations.

La microsimulation dynamique permet quant à elle d’introduire la notion de temps et ce qui peut en découler, comme les évolutions législatives, les mutations sociétales (allongement des études par exemple, modification du marché du travail), les dynamiques démographiques (hausse de l’espérance de vie, baisse de la fécondité), etc.

L’idée fondamentale de la microsimulation consiste à modéliser et simuler les évènements et leur probabilité de survenance au niveau de l’individu. Dans le cas de Prisme, l’unité de projection du modèle est en l’occurrence l’assuré. La plupart des modèles de microsimulation se basent sur un échantillon d’individus, même si l’exhaustivité n’est pas ou n’est plus un frein, compte tenu des moyens informatiques actuels. Prisme repose sur un échantillon au 1/20ᵉ extrait des bases de gestion de la Cnav : celles-ci comprennent toutes les personnes nées en France hexagonale et en Outre-mer, ainsi que les personnes nées à l’étranger et ayant été immatriculées en France à un moment de leur vie, qu’elles soient encore ou non présentes sur le territoire français. Ces bases de gestion exhaustives, puisque découlant de l’activité même du métier retraite de la Cnav, sont d’une richesse infinie tant elles offrent une diversité de profils qui représentent autant de matière pour alimenter le modèle. L’échantillon compte 5,5 millions d’individus.

Au fil du temps et notamment avec l’histoire sociale récente, le modèle de la Cnav a pu démontrer toute sa pertinence et il s’est de plus forgé, grâce à sa polyvalence et sa malléabilité, une véritable identité dans les évaluations des différentes réformes de retraites pour devenir un outil essentiel d’aide à la décision des politiques publiques dans ce domaine.

 

Prisme : un modèle en constante évolution

Depuis 2005, Prisme est l’outil central des travaux de prospective menés par la Cnav sur les retraites de base du régime général. Même si les méthodes et l’architecture globale du modèle sont demeurées les mêmes, Prisme n’a cessé d’évoluer tout au long de ces quinze dernières années : des évolutions évidemment en lien avec les changements de réglementations, pour actualiser les informations sur les assurés, améliorer la modélisation des différents évènements, mais également des évolutions du champ couvert ; car progressivement, Prisme est devenu un modèle couvrant l’intégralité du système de retraite en France.

L’utilisation de l’outil pour la sphère « métier » de la Cnav soumet ses concepteurs à l’obligation d’une veille constante sur la législation concernant les retraites, afin que les modifications même les plus récentes soient intégrées.

L’axe majeur des améliorations du modèle reste néanmoins celles liées aux fortes évolutions réglementaires instaurées par les réformes successives (encadré 1). Chaque réforme apportant de nouvelles règles et des mesures spécifiques, leur implémentation dans Prisme nécessite leur retranscription en langage informatique. Cette étape est d’autant plus délicate que les normes nouvelles ne concernent pas obligatoirement tous les individus et que certains dispositifs sont soumis à des critères d’éligibilité très fins, éléments que le modèle doit alors également projeter sur plusieurs décennies. La mise en place du dispositif de retraites anticipées pour carrière longue lors de la réforme de 2003 en est un bon exemple, en fixant des modalités différentes selon l’âge de départ, l’âge de début d’activité, la durée cotisée ou encore la durée validée, etc. Si la réforme de 2003 a été intégrée dès la conception de Prisme, les suivantes (2010, 2012 et 2014) ont permis de confirmer la souplesse et la flexibilité du modèle dans la prise en compte de nouveaux paramètres.

C’est d’ailleurs cette nécessité de pouvoir faire évoluer le modèle et d’être au plus proche de la réglementation qui a conduit en partie au choix de la microsimulation. En particulier, dans le mode de calcul de la pension des régimes en annuités, il n’y a ni linéarité, ni proportionnalité rendant difficile voire impossible l’implémentation précise de la législation dans un modèle macro. Pour illustrer ce principe, le passage de 200 à 150 heures de SMIC nécessaires pour cotiser un trimestre n’aura pas le même effet pour tout le monde :

  • une personne ayant déjà cotisé ses quatre trimestres annuels sur la base de 200 heures ne sera aucunement concernée par cette évolution pour sa retraite de base ;
  • en revanche, une personne qui cotisait avant la réforme seulement trois trimestres sur la base des 200 heures de SMIC devrait dorénavant en cotiser quatre ;
  • et celle qui avait seulement deux trimestres cotisés pourrait parvenir à trois voire quatre trimestres selon ses revenus.

Avec la microsimulation, la possibilité de suivre les parcours de vie au cas par cas se révèle être bien plus précise que l’application d’un correctif à un effectif agrégé.

La microsimulation constitue par ailleurs un atout pour effectuer des analyses fines basées sur des données individuelles réelles. Cette méthode permet la construction d’indicateurs avec tous les niveaux d’analyse et d’agrégation de population souhaités, par exemple : pensions moyennes, masses financières, analyses par cycle de vie, étude de certains éléments de pension ou de carrière, analyse des gagnants/perdants en cas d’estimation des effets d’une réforme, etc. Cela prend tout son sens lorsque l’instauration d’une mesure vise par exemple à améliorer les conditions d’une population particulière, comme ce fut le cas pour les bénéficiaires du dispositif de retraite anticipée pour carrière longue ou encore la mise en place du compte pénibilité, et à en étudier le suivi dans le temps. Ici aussi, être en mesure d’affiner ces indicateurs est une grande aide pour la fonction métier de la Cnav.

La microsimulation ouvre donc des possibilités d’analyses innombrables, mais ces analyses n’ont de valeur que si les données sont riches (y compris sur le passé – pour mieux estimer le futur) et le nombre d’individus dans l’échantillon important. C’est bien sur ces aspects que Prisme a bâti sa robustesse. Et ceci a été possible, car Prisme est développé par un régime de retraite qui s’appuie sur ses données de gestion et utilise aussi le modèle pour sa gestion.

 

Le régime général : un champ d’application déjà très large

Initialement, le modèle a été développé sur le champ des salariés du privé, affiliés au régime général. Ce champ peut paraître relativement restreint au regard du nombre de régimes de retraites en France (). Néanmoins, il s’agit du principal , représentant en 2018 plus de 90 % des affiliés à un régime de retraite, et près de 40 % du total des prestations vieillesses versées.

Qui plus est, pour projeter les futurs cotisants et retraités, il est indispensable de retenir une population plus large que les seuls cotisants actuels de ce régime. Cette population, la Cnav la connaît puisqu’elle gère pour la Cnam (Caisse nationale d’assurance maladie), l’ensemble des immatriculés en France (qu’ils aient ou non un droit retraite), i.e. toute personne qui a un numéro de Sécurité sociale (voir infra).

Au-delà de la simple population à modéliser, Prisme doit en effet simuler tous les éléments qui peuvent avoir une incidence sur le montant futur de la pension d’un individu. Par exemple, dans l’optique de parvenir à obtenir un nombre de trimestres cotisés ou validés tous régimes confondus, il est primordial pour les poly-affiliés de déterminer la partie de la carrière ne relevant pas du régime général. C’est pour cette raison que le modèle s’appuie sur toutes les données possibles, qu’elles soient propres à la Cnav ou bien externes.

 

Des données individualisées exploitables, riches et variées

La Cnav dispose de fichiers de gestion qui regroupent les éléments de carrière des salariés au régime général et permettent le paiement des retraites (Ouvrir dans un nouvel ongletDSPR, 2020 ; Ouvrir dans un nouvel ongletCOR, 2020). Ces bases contiennent l’intégralité des personnes qui sont ou ont été affiliées à la Sécurité sociale, soit plus de (mais pouvant encore ouvrir des droits à réversion). Deux référentiels sont mobilisés :

  • le Système national de gestion des identités (SNGI), pour les données démographiques,
  • et le Système national de gestion des carrières (), pour les éléments de carrière des assurés.

Ce sont des bases de données individuelles, et c’est justement là que réside toute la finesse et la richesse de leur contenu. La collecte des données individuelles débute dès le certificat de naissance (ou au moment de l’immatriculation pour les personnes nées hors de France). Au cours de la carrière professionnelle, elle se poursuit avec un fin niveau de détail sur les revenus, les employeurs, les caractéristiques de l’emploi occupé, le type de contrat, etc., afin de garantir les droits des assurés à hauteur de leurs contributions. De manière plus générale, on distinguera trois grandes temporalités dans l’ensemble des bases de données mobilisées : la carrière, la liquidation et la prestation.

Le répertorie les états civils des assurés nés en France et des personnes nées à l’étranger qui relèvent d’un régime français de Sécurité sociale. Pour les personnes nées en France, il est alimenté quotidiennement par le RNIPP (Répertoire national d’identification des personnes physiques) géré par l’Insee. À l’inverse, le SNGI alimente le RNIPP pour les personnes nées hors de France. C’est à partir du SNGI que sont tirés au sort les individus qui seront présents dans la table initiale du modèle (figure 1).

Les proviennent du SNGC+. Il mémorise la totalité de la carrière des assurés sociaux pour le calcul de leur retraite au régime général : salaires cotisés, trimestres validés au régime général et dans les autres régimes, périodes de chômage, de maladie, etc. L’information sur les salaires provient des mais aussi de toutes les déclarations qui peuvent être effectuées par les employeurs dans le cadre de leurs obligations légales. Les données relatives au chômage sont fournies par Pôle emploi, les données maladies sont transmises par la Cnam et les cotisations AVPF (Assurance vieillesse des personnes au foyer) par la Cnaf (Caisse nationale des allocations familiales).

À ces données issues des référentiels nationaux, s’ajoutent celles provenant du Système national des statistiques des prestataires (SNSP), base de données statistiques exhaustive qui contient l’ensemble des retraités du régime général.

Par ailleurs, d’autres données externes sont mobilisées pour compléter et enrichir ponctuellement celles de la Cnav. Car même si ces dernières sont riches, tant en termes de variables qu’en termes d’individus, elles sont circonscrites aux besoins métier du régime général. Or, les nouveaux besoins de simulation requièrent d’intégrer toujours plus d’informations, que ce soit pour gagner en précision ou pour suivre le flux réglementaire. Des appariements sont alors mis en œuvre, avec des méthodes spécifiques (pour plus de détail, voir encadré 2).

 

Figure 1. Schéma d’architecture Prisme

 

 

Encadré 2. L’Appariement optimal : méthode de complétion

Les bases de gestion de la Cnav sont riches et de mieux en mieux alimentées par les autres régimes. Néanmoins, bien que l’amélioration du transfert des données autres régimes soit plus que notable, une partie des données de carrières du Service des retraites de l’État (SRE) sont incomplètes. Ces éléments lacunaires doivent être remplacés par des informations permettant le travail de projection dans Prisme ; on appelle cette étape : la complétion. L’appariement optimal (Ouvrir dans un nouvel ongletLesnard et de Saint Pol, 2006) est la méthode utilisée par la Cnav pour cette phase préliminaire de « préparation des données ».

L’appariement optimal est une technique consistant à mesurer la distance entre des séquences*, deux à deux, et à transformer l’une en l’autre au moyen d’opérations élémentaires. Trois opérations sont possibles** : la substitution d’un élément par un autre, l’insertion d’un élément ou la suppression d’un élément dans la séquence. Un coût*** est affecté à chacune des opérations élémentaires. La distance entre deux séquences est la somme de ces coûts ; l’appariement nécessite que ces derniers soient les plus faibles possibles.

Les données de l’EIC (Échantillon interrégimes de cotisants) de la Drees sont une source d’information précieuse pour la complétion. Ainsi, chaque individu de l’échantillon Cnav présentant une carrière incomplète est comparé aux individus de l’EIC dans l’objectif de l’apparier à un « jumeau » (individu présentant le moins de dissemblances dans la comparaison du parcours professionnel : i.e. distance minimale). Ce « jumeau » de carrière permet la substitution des éléments manquants par ceux connus dans le fichier de l’EIC. Ainsi complétée, la base de gestion de la Cnav est exploitable par Prisme.

 

* Une séquence est un élément longitudinal composé d’un ensemble d’états successifs caractérisant, dans notre cas, le parcours professionnel d’un individu.

** Pour Prisme, sont utilisées les opérations de substitutions.

*** Dans Prisme, un coût de substitution vaut 1/probabilité de la transition. Le coût d’un état vers lui-même est nul.

 

Prisme simule la « vraie vie »

La première fonction de Prisme est de permettre la simulation de trajectoires individuelles : des périodes d’emploi, des transitions de carrière, des salaires et cotisations, l’arrivée d’un enfant, les accidents de vie (invalidité, accident de travail, décès) en somme ce que l’on appelle des événements. Le principal objectif est de prédire la date de liquidation et le niveau de pension des assurés à un horizon défini, afin d’obtenir certains indicateurs tels que les masses de pensions versées et les recettes que perçoit le régime de retraite.

Pour effectuer une projection avec Prisme, il est nécessaire d’utiliser des informations « sur le passé » qui servent à la fois :

  • à compléter le profil actuel des individus : quels sont les éléments de leur vie qui peuvent avoir une incidence future sur la constitution de leurs droits, sur l’âge estimé auquel ils pourraient partir en retraite, etc. ;
  • à estimer les événements dans le futur, et ainsi assurer une cohérence et une relative continuité des logiques et structures socio-professionnelles des assurés comme des prestataires des régimes de retraite.

 

La trimestrialisation : un gage de précision

Le moment auquel intervient un événement est capté dans Prisme, à la fois dans la carrière de l’individu, mais également en infra-annuel : c’est ce qu’on appelle la trimestrialisation. Car Prisme fonctionne sur un pas trimestriel, sauf pour les départs en retraite et les décès qui sont estimés mensuellement, alors que la plupart des modèles de projection existants dans le système de retraite français fonctionnent .

Atout fort du modèle, la trimestrialisation place les événements au plus près de la législation actuelle des régimes de retraite (particulièrement pour le régime général) qui repose en effet sur une unité : le trimestre. Ainsi chaque événement de carrière, du passé, comme du futur est estimé individuellement trimestre par trimestre. En ce sens, trimestrialiser permet de reconstituer ou de simuler une plus grande complexité des carrières en infra-annuel. La situation d’activité des individus est ainsi plus représentative de la réalité des situations de vie des assurés : des périodes d’activités salariés, des périodes de chômage, des périodes de maladie, etc. le tout au sein d’une même année.

 

Les trajectoires de vie pour structurer le modèle

L’architecture de Prisme se veut calquée sur celle de la « vraie vie » (figure 1). Le programme est composé de trois modules représentant des séquences de vie (modules « Activités et salaires », « Retraite ») ou des informations individuelles démographiques (module « Démographie »).

Les nombreux événements qui composent la vie des individus sont modélisés dans ces modules, et attribués selon la probabilité que chacun a de vivre ou non ceux-ci (naissance, chômage, maladie, décès, etc.). Est constituée ainsi une trajectoire de vie singulière sur laquelle le modèle va s’appuyer pour évaluer – à terme – un moment de départ à la retraite et un montant de pension.

 

Le module « Démographie »

Sans cesse actualisé, il détermine – entre autres – tout au long de la vie de l’assuré des événements tels que : les naissances, les décès, les migrations (entrées exclusivement) mais aussi la descendance des assurés (nombre d’enfants).

Les simulations de décès sont différenciées selon que l’on soit prestataire c’est-à-dire percevant une pension de retraite (quotients de mortalité estimés sur les observations Cnav selon que le prestataire perçoit ou pas une pension d’ex-invalide ou au titre de l’inaptitude) ou non-prestataire (projections Insee).

Les naissances pour les hommes sont distribuées de manière aléatoire, tout en respectant un indice conjoncturel de fécondité. Pour les femmes est ajouté un calendrier des naissances, selon une équation logistique tenant compte de facteurs tels que l’âge et le temps écoulé depuis la sortie des études.

Ce module permet aussi d’ajouter les nouveaux assurés nés au cours des années simulées, selon les projections de population de l’Insee.

 

Le module « Carrière »

Il permet de définir, pour les actifs, une situation par rapport à l’emploi à chaque trimestre, que l’on appelle un report. Il caractérise ainsi la situation de l’assuré mais aussi sa date d’entrée sur le marché du travail.

. Tout au long de la projection, de nouveaux reports sont attribués aux individus selon un pas trimestriel et un enchaînement d’équations ; pour cela le modèle utilise des différenciées par report précédent. En effet les transitions entre les différents états d’activité sont dépendantes de l’état qui précède (Berteau-Rapin, Beurnier et Denayrolles, 2015). Le choix de ce type de modélisation est motivé par la nécessité de contrôler à chaque pas de projection les effectifs se répartissant entre les différents types de reports de carrière. Les probabilités servant à modéliser les transitions peuvent être représentées comme dans la figure 2. Chacune des probabilités est déclinée selon le genre, le lieu de naissance, et l’âge de l’assuré. Elles sont la traduction du « coût de transition » que représente le passage d’un état à un autre pour un assuré ; certaines transitions sont plus fréquentes (moins « coûteuses ») et d’autres beaucoup plus rares, néanmoins leur inclusion est indispensable pour la bonne modélisation de la population en projection.

Afin d’estimer ces logits multinomiales, une période de quelques années est sélectionnée dans le passé, sur laquelle sont observées et mesurées les différentes transitions de carrière. Techniquement, à chaque état sont calculées des probabilités cumulées de transition ; puis un aléa est tiré pour chaque individu. La comparaison de cet aléa aux probabilités cumulées de transition permet d’attribuer un nouvel état, et ainsi de suite.

Toutefois,  ; par exemple, la probabilité pour qu’un assuré percevant à un trimestre donné une pension une allocation chômage perçoive au trimestre suivant une allocation maladie, est égale à 0.

Ce module permet également de simuler des salaires et revenus, et par ce fait des . Ces éléments sont essentiels pour approcher un montant de pension au niveau micro et des masses de droits propres au niveau macro.

 

Le module « Retraite »

Il permet d’estimer la probabilité de départ de chacun des assurés – mois après mois – dès leur 55ᵉ anniversaire (dans la limite de leur 75 ans). Avec la date de départ ainsi simulée, on peut également calculer des montants de pension au regard des informations de vie, récupérées sur le passé ou modélisées au cours de la projection.

Au total, ce module comptabilise 48 équations logistiques différenciées par âge, sexe, types de départ et dernier régime d’affiliation. Différencier les équations permet d’adapter les variables explicatives (délai depuis la possibilité d’un départ anticipé, distance par rapport au taux plein, situations vis-à-vis de l’emploi, etc.) et ainsi, de saisir de manière plus fine les particularités des profils d’assurés liquidant : décoteurs, surcoteurs, partant à l’âge d’annulation de la décote, etc.

Tout au long de la projection, tant que l’assuré n’a pas liquidé ses droits à la retraite, il rentre dans les différentes équations logistiques selon son profil chaque mois, et si la probabilité estimée à partir du vecteur de variables explicatives est inférieure à un aléa tiré de manière uniforme, l’assuré part à la retraite. À noter qu’une reprise d’activité salariée au régime général, après le passage à la retraite, constitue également un événement modélisé dans le cadre du cumul emploi-retraite.

 

Figure 2. Schéma des probabilités de passage d’un état à un autre dans Prisme

 

 

La préoccupation de finesse et de contrôle du modèle…

Au-delà de la colonne vertébrale de Prisme, démographie – carrière – retraite, la recherche de finesse des modélisations et le contrôle même du modèle de microsimulation constituent un travail important.

La prise en compte de certaines prestations qui ne concernent qu’une partie de la population, telles que la réversion ou l’Allocation de solidarité aux personnes âgées (ASPA ou minimum vieillesse), témoigne de cette intention. En effet, bien que ces masses de prestations représentent plus de 10 % des prestations versées par la Cnav, Prisme est un des rares modèles français à en estimer les montants (Ouvrir dans un nouvel ongletDi Porto et Ghernaout, 2020). À l’instar des droits directs, le modèle a récemment été élargi à l’ensemble des régimes de retraite français dans le cadre des simulations de réforme systémique. Ainsi, lorsque le décès d’un conjoint survient au sein d’un couple marié, une pension dite de réversion peut être attribuée au conjoint survivant sous certaines conditions (âge, ressources…). Celle-ci correspond à une partie de la pension du conjoint décédé (54 % au régime général). Ces pensions sont simulées dans Prisme par estimation des mariages, du veuvage, de la pension du conjoint décédé et des ressources du conjoint survivant. Il en va de même, pour l’ASPA, allocation attribuée aux retraités aux faibles ressources. Prisme intègre son calcul pour les populations répondant aux critères d’éligibilité (âge, ressources, résidence, situation familiale, subsidiarité). Outre l’estimation de l’ensemble des pensions de retraite afin d’estimer l’essentiel des ressources, ceci implique de simuler la résidence sur le territoire français des prestataires d’une pension de droit propre, ainsi que le « non-recours » qui s’avère encore élevé pour cette allocation.

Cette recherche de finesse se retrouve aussi dans les nombreuses opérations de calage effectuées afin de respecter les hypothèses macroéconomiques fournies par le Conseil d’orientation des retraites ou la Direction de la Sécurité sociale (DSS) : évolution du nombre de cotisants par exemple, ou part des différents types de carrière dans la population générale (poly-pensionnés, etc.). Ces opérations de calage sont indispensables tant l’outil de microsimulation est sensible : il faut s’assurer continuellement de la cohérence des simulations de long et de court terme, en mobilisant des méthodes de validation et un contrôle accru du modèle.

 

… car Prisme n’est pas une boule de cristal

Compte tenu de sa puissance, un modèle de microsimulation dynamique pourrait avoir tendance à modéliser – dans un effet boule de neige – sa « propre logique ». Afin de contenir le modèle et d’évaluer les résultats obtenus, plusieurs étapes de contrôle ponctuent le travail de projection (Ouvrir dans un nouvel ongletBrossard et alii, 2016). Elles s’appuient à la fois sur l’évaluation de la cohérence des sorties vis-à-vis des observations de la réalité, comme lors des étapes de « calages », mais aussi par le contrôle des hypothèses macroéconomiques, comportementales et méthodologiques. De nombreux tests de sensibilité des résultats à ces différentes hypothèses sont opérés par les statisticiens lors du traitement. Par ailleurs, en amont même du lancement de Prisme, la validité du modèle est vérifiée lors de l’étape de modélisation des différentes équations logistiques que ce soit par exemple pour les transitions de carrière ou les départs en retraite. La qualité des estimations est notamment vérifiée en comparant de manière rétroprojetée les estimations et les données constatées.

Pour mesurer la sensibilité des résultats aux hypothèses macroéconomiques, de nombreuses variantes sont utilisées. Concrètement, cela revient souvent à modifier les valeurs cibles du taux de chômage ou de l’évolution du . De multiples scénarios sont analysés au regard de différents indicateurs, tels que les masses de prestations et de recettes, ou les valeurs moyennes des décalages de départ et des variations de pensions.

Les projections de retraite, en particulier lorsqu’il s’agit de simuler une réforme, nécessitent également des tests de sensibilité des résultats aux hypothèses méthodologiques de comportement de départ et de prolongation d’activité. Pour de nombreux modèles statistiques, la problématique d’entrée repose principalement sur le choix d’une approche déterministe ou probabiliste.

L’approche probabiliste entraîne une modification des probabilités individuelles sous-jacentes à l’évolution des paramètres définis par la réforme au cours de la projection. En effet, les événements simulés par le programme via de nombreuses modélisations logistiques (voir supra) et leurs probabilités d’occurrence dépendent des changements législatifs à travers les variables explicatives des équations logistiques. L’avantage de cette approche est d’offrir de meilleures variabilités individuelles en sortie et d’intégrer des scénarios plus complexes souvent plus proches des situations observées sur le réel.

Cependant, si l’approche probabiliste est celle nativement modélisée dans Prisme, les statisticiens de la Cnav ont aussi recours à l’approche déterministe. Cette approche est exclusivement utilisée lors de la simulation de réforme pour l’événement « liquidation retraite », tous les autres événements étant traités en probabiliste. L’approche déterministe présente l’avantage de conditionner la simulation par des hypothèses comportementales préalablement définies. Ainsi, les comportements de départ à la retraite par type d’assuré sont connus a priori et la simulation se conforme à ces derniers sans les faire évoluer au fil de la projection, rendant plus aisée la comparaison des situations individuelles et permettant donc la création de scénarios contrefactuels. On retrouve cette approche dans certains modèles de projection tel que le modèle Ines de l’Insee, de la Drees et de la Cnaf pour la simulation des politiques sociales et fiscales (Fredon et Sicsic, 2020).

 

L’élargissement progressif aux autres régimes de retraites

La prise en compte des autres régimes dans le modèle ne constitue pas en soi une révolution totale.

Pour pouvoir calculer finement les conditions de ressources au sein des modules réversion et minimum vieillesse du régime général, l’estimation des pensions des régimes complémentaires Agirc-Arrco et Ircantec était déjà réalisée de manière précise depuis plusieurs années. Et comme déjà mentionné plus haut, depuis ses débuts, le modèle a entrepris de simuler des fragments, voire l’intégralité des carrières cotisées ou validées dans d’autres régimes de base que le régime général. Mais ces informations étaient agglomérées sans aucune distinction : elles sont dorénavant décomposées régime par régime.

Cet élargissement s’est déroulé en deux grandes étapes.

La première fut , entré en vigueur à partir du 1ᵉʳ juillet 2017 pour les assurés nés à partir de 1953. Le principe de cette mesure est de permettre un calcul et un versement unique pour les poly-pensionnés, c’est-à-dire les personnes ayant été affiliées au cours de leur carrière à plusieurs des trois régimes dits . Le RSI (aujourd’hui SSI) et la MSA ayant été alignés sur le régime général à partir de 1973, la proximité des règles de calcul de la pension entre les trois régimes a facilité leur intégration dans le modèle en termes de programmation. En revanche, l’implémentation des régimes non-alignés a été plus complexe.

La seconde étape fait suite au projet de régime unique de retraite en points (et non plus en annuités comme actuellement au sein de l’essentiel des régimes de base) lancé en 2018. Cela impliquait pour Prisme de renforcer sa capacité à simuler des retraites tous régimes, en modélisant plus finement tous les régimes de base ainsi que les retraites complémentaires.

L’ampleur de la tâche était cette fois-ci toute autre, dans la mesure où il devenait nécessaire de comprendre, assimiler et retranscrire les réglementations subtiles propres à chaque régime : fonctionnaires territoriaux, hospitaliers ou d’État, régimes spéciaux (SNCF, RATP, industries électriques et gazières, etc.), professions libérales et exploitants agricoles. Une fois apte à déterminer et projeter les trimestres associés à chaque régime, avec les salaires et revenus qui en découlent, ainsi que les dates de départ spécifiques à certains régimes, Prisme était désormais en mesure de simuler l’ensemble du système de retraite en France. Les allées et venues d’un assuré d’un régime à un autre quel qu’il soit ne représentent plus une limite.

Fort de cette faculté, Prisme a alimenté pendant plus d’un an les travaux du Haut-commissariat à la réforme des retraites : en juillet 2019, cette instance a remis au gouvernement son rapport sur la mise en place d’un système universel de retraite (Ouvrir dans un nouvel ongletDelevoye, 2019). Un projet de loi portant réforme des retraites a été déposé début 2020. L’étude d’impact menée par la Direction de la Sécurité Sociale pour accompagner le projet de loi est d’ailleurs en grande partie construite sur les .

 

Penser la retraite de manière universelle au sein d’un seul et même modèle

L’approche du « tous régimes » au sein d’un seul et même modèle a par ailleurs l’avantage de s’exonérer des biais méthodologiques que l’on observe lors de la comparaison entre différents modèles. La mécanique et l’enchaînement des évènements projetés sont pleinement maîtrisés et l’interaction des différentes hypothèses plus lisibles. Les ordres de grandeur ainsi obtenus sont alors plus facilement comparables et les écarts explicables.

Par ailleurs, mieux estimer les pensions versées par l’ensemble du système de retraite permet également d’être plus précis sur le champ initial, le régime général, que ce soit pour calculer l’écrêtement du , la condition de ressources pour la réversion ou l’estimation du différentiel avec le plafond de l’ASPA.

Cette évolution de Prisme prend également tout son sens au regard de la multiplicité et de la diversification des demandes en matière d’aide à la décision des politiques publiques. L’expérience de la mise en place de la LURA avec l’intégration des régimes alignés a offert à la direction Statistiques, prospective et recherche de la Cnav une bonne vision des questions que soulève ce type de mesure. Cette expérience construite au fil des années a su révéler une certaine capacité d’anticipation, ou plus modestement de prospective, quant aux interrogations et aux moyens à mettre en œuvre afin de répondre au mieux à ces sollicitations et dans les meilleurs délais.

Au-delà de tous ces aspects techniques, Prisme est aussi une aventure humaine et fédératrice. Cette belle mécanique ne se conçoit pas sans une collaboration de long terme, et elle permet de prendre pleinement conscience de l’apport du travail en équipe et de la pluridisciplinarité. Maintenir tout cela constitue peut-être la principale difficulté dans la pérennité d’une telle structure. Les statisticiens sont maintenant des data scientists, la manipulation des bases de données volumineuse tend vers le big data et pourtant, derrière ces innovations, il s’agit toujours de la même volonté de fédérer des expertises autour d’un projet commun.

Bien entendu, Prisme entre dans la catégorie des outils encore perfectibles. Pris individuellement, tous les choix et les hypothèses retenus peuvent être débattus. Les méthodologies doivent toujours tendre à plus de pertinence et les améliorations techniques à plus d’efficacité. De même, des décompositions plus fines encore constituent une piste d’amélioration. À l’image de la célèbre cathédrale barcelonaise de Gaudí, Prisme peut d’une certaine manière être perçu comme un éternel chantier.

 

Fondements juridiques

Fonctionnaires et cadres du secteur privé.

Direction de la recherche, des études, de l’évaluation et des statistiques, service statistique du ministère des Solidarités et de la santé.

Réforme mise en place au 1ᵉʳ janvier 2004 suite à l’adoption de la loi du 21 août 2003 (voir les références juridiques en fin d’article).

Voir à ce sujet l’article sur le modèle TRAJECTOiRE (Cheloudko et Martin, 2020).

Il suffit d’avoir cotisé un seul trimestre en tant que salarié du secteur privé pour ouvrir des droits au régime général et prétendre ensuite à une pension de retraite.

Ces effectifs sont supérieurs à la population totale française : ils regroupent toute personne ayant cotisé au moins un trimestre, née ou non en France et présente ou non sur le territoire français, décédée ou non.

SNGC+ car en 2017 avec la mise en place de la liquidation unique pour les régimes alignés (LURA) les informations de revenus des indépendants et salariés agricoles ont été intégrées au SNGC, venant compléter les informations du régime général.

Créé par le décret n° 2018-390 (voir les références juridiques en fin d’article).

Les reports au compte des individus de l’ensemble des régimes sont présents dans la base, ainsi que les salaires et revenus des régimes alignés. Cependant, les salaires et revenus des autres régimes n’y figurent pas.

Voir les articles sur la DSN parus dans le numéro N1 du Courrier des statistiques, et notamment (Humbert-Bottin, 2018).

C’est le cas du modèle de microsimulation de l’Agirc-Arrco, ou encore de TRAJECTOiRE, le modèle de la Drees (Cheloudko, Martin, 2020).

Des conditions de travail pénibles, pour les assurés en emploi salarié, peuvent être simulées afin d’acquérir des points sur leur compte professionnel de prévention et ainsi des droits supplémentaires à la retraite.

La régression logistique multinomiale permet d’estimer la probabilité de survenue d’un événement pour une variable avec plus de deux modalités compte tenu des caractéristiques individuelles.

Transitions impossibles d’un point de vue légal ou trop rares pour être estimées avec fiabilité.

Une assiette de cotisations est l’ensemble des éléments de base servant au calcul des cotisations.

Le salaire moyen par tête (SMPT) rapporte les masses salariales brutes versées par l’ensemble des employeurs au nombre de salariés en personnes physiques.

Liquidation unique des régimes alignés, dispositif institué par l’article 43 de la loi sur les retraites de 2014.

À savoir la Cnav (régime général), la MSA (Mutuelle sociale agricole) pour les salariés agricoles et SSI (Sécurité sociale des indépendants, auparavant RSI).

Voir les références juridiques en fin d’article.

Une pension de base au taux plein doit être supérieure à un minimum dit « contributif ». Un complément peut ainsi être versé à un assuré, sous réserve que l’ensemble de ses pensions obligatoires (de base et complémentaires) ne dépasse pas un certain plafond.

Pour en savoir plus

BERTEAU-RAPIN, Caroline, BEURNIER, Paul et DENAYROLLES, Émilie, 2015. La modélisation des trajectoires professionnelles dans le modèle Prisme. In : Économie et statistique. [en ligne]. 17 décembre 2015. Insee, N°481-482, pp. 97-120. [Consulté le 10 décembre 2020].

BLANCHET, Didier, 2020. Des modèles de microsimulation dans un institut de statistique – Pourquoi, comment, jusqu’où ?. In : Courrier des statistiques. [en ligne]. 29 juin 2020. Insee, n°N4, pp. 6-22. [Consulté le 10 décembre 2020].

BLANCHET, Didier, BUFFETEAU, Sophie, CRENNER, Emmanuelle et LE MINEZ, Sylvie, 2011. Le modèle de microsimulation Destinie 2 : principales caractéristiques et premiers résultats. In : Économie et Statistique. [en ligne]. 20 octobre 2011. Insee, n°441-442, pp. 101-121. [Consulté le 10 décembre 2020].

BROSSARD, Cécile, COUHIN, Julie, GRAVE, Nathanël et OLIVEAU, Jean-Baptiste, 2016. Ouvrir dans un nouvel ongletUne évaluation des réformes des retraites : quelle sensibilité des résultats aux hypothèses ?. In : Retraite et société. [en ligne]. Cnav, 2016/2, n°74, pp. 79-115. [Consulté le 10 décembre 2020].

CCSS, 2020. Ouvrir dans un nouvel ongletLes comptes de la sécurité sociale : résultats 2019, prévisions 2020 et 2021. [en ligne]. Septembre 2020. Commission des comptes de la Sécurité sociale. [Consulté le 10 décembre 2020].

CHELOUDKO, Pierre et MARTIN, Henri, 2020. Une décennie de modélisation du système de retraite – La genèse du modèle de microsimulation TRAJECTOiRE. In : Courrier des statistiques. [en ligne]. 29 juin 2020. Insee, n°N4, pp. 23-41. [Consulté le 10 décembre 2020].

COR, 2020. Ouvrir dans un nouvel ongletÉvolutions et Perspectives des retraites en France. [en ligne]. 26 novembre 2020. Conseil d’orientation des retraites. [Consulté le 10 décembre 2020].

DELEVOYE, Jean-Paul, 2019. Ouvrir dans un nouvel ongletPour un système universel de retraite. [en ligne]. Juillet 2019. Haut-commissariat à la réforme des retraites. [Consulté le 10 décembre 2020].

DI PORTO, Alessandra et GHERNAOUT, Nassima, 2020. Ouvrir dans un nouvel ongletLa pension de réversion au régime général au fil des générations. In : Retraite et société. [en ligne]. Cnav, 2020/1, n° 83, pp. 75-106. [Consulté le 10 décembre 2020].

DSPR, 2020. Ouvrir dans un nouvel ongletPrésentation du modèle Prisme. [en ligne]. 5 mars 2020. Cnav, Séance plénière du Conseil d’orientation des retraites, point sur les modèles de microsimulation. [Consulté le 10 décembre 2020].

FREDON, Simon et SICSIC, Michaël, 2020. Ines : le modèle qui simule l’impact des politiques sociales et fiscales. In : Courrier des statistiques. [en ligne]. 29 juin 2020. Insee, n°N4, pp. 42-60. [Consulté le 10 décembre 2020].

HUMBERT-BOTTIN, Élisabeth, 2018. La déclaration sociale nominative – Nouvelle référence pour les échanges de données sociales des entreprises vers les administrations. In : Courrier des statistiques. [en ligne]. 6 décembre 2018. Insee, n° N1, pp. 25-34. [Consulté le 10 décembre 2020].

LESNARD, Laurent et DE SAINT POL, Thibaut, 2006. Ouvrir dans un nouvel ongletIntroduction aux méthodes d’appariement optimal (Optimal Matching Analysis). In : Bulletin de méthodologie sociologique. [en ligne]. 1ᵉʳ avril 2006. Open Edition, Journals, n°90, pp. 5-25 [Consulté le 10 décembre 2020].