Étude de cas · Assurance · GLM / Tarification

Tarification de prime pure — freMTPL2

Trois familles de GLM et un concurrent gradient boosté comparés sur le jeu de données canonique de responsabilité civile auto français (678 000 polices). Tweedie gagne sur le pouvoir de segmentation ; Poisson + Gamma gagne sur le lift du décile supérieur. Choisir entre les deux est une décision actuarielle, pas une décision de modélisation.

Lecture · 7 min · 1607 mots Meilleur sur Gini · GLM Tweedie (0,310) Meilleur sur lift décile sup. · GLM Poisson + Gamma (2,66) Données · 678 013 polices · ~5 % avec sinistre Surdispersion · Var/Moy = 1,083 (légère, en faveur de Tweedie)

Résumé

Sur le jeu de données canonique freMTPL2 de responsabilité civile auto français, un GLM Tweedie Poisson-composé bat à la fois un GLM Poisson + Gamma ajusté séparément et un concurrent gradient boosté sur la métrique de segmentation standard (coefficient de Gini sur la prime pure par police). Mais Poisson + Gamma gagne sur une autre métrique opérationnellement pertinente — le lift du décile supérieur — et reste le choix le plus défendable lorsque les déterminants de la fréquence et de la gravité divergent. Le « bon » modèle de tarification est celui dont les biais correspondent à la façon dont le moteur de tarification et l'équipe de souscription utiliseront effectivement le score.

La question métier

Un assureur auto veut des estimations de pertes attendues par police: la prime pure — assez précises pour alimenter un moteur de tarification par paliers et assez explicables pour validation actuarielle. Deux usages opérationnels reposent sur le score :

Un GLM Poisson historique était déjà en production (standard du secteur). La question : Tweedie ou un concurrent ML pourrait-il améliorer significativement l'une ou l'autre dimension ?

Données

Vrai freMTPL2 de la Fédération française des sociétés d'assurances, redistribué via Kaggle sous floser/french-motor-claims-datasets-fremtpl2freq (sinistres) et floser/fremtpl2sev (gravités). Après jointure et plafonnement des gravités au 99,9e percentile (pratique standard pour limiter la distorsion des sinistres catastrophiques) :

CSV · KaggleNiveau policeGravités plafonnées à 99,9 %Validation 80/20

EDA & surdispersion

Deux faits empiriques dominent la décision de modélisation :

  1. La distribution du nombre de sinistres est très concentrée sur zéro. Près de 95 % des polices ne déclarent aucun sinistre. Parmi celles qui le font, la plupart en déclarent exactement un — la queue lourde des deux-ou-plus est réellement petite.
  2. La gravité a une queue droite épaisse. La plupart des sinistres positifs sont modestes (~1 000 EUR), mais une longue queue s'étend jusqu'au plafond par police. Modéliser la gravité en espace linéaire sans lien logarithmique est exclu.
Distribution du nombre de sinistres et histogramme de la gravité
Figure 1. Gauche : nombre de sinistres par police en axe log-y — 95 % à zéro, ~5 % avec un sinistre, très peu avec deux ou plus. Droite : distribution de la gravité sur les sinistres positifs, plafonnée à 30 000 EUR pour la lisibilité — la queue droite s'étend bien au-delà du graphique.

Le ratio variance/moyenne empirique du nombre de sinistres est de 1,083. Surdispersion légère — Poisson est une référence défendable, mais une famille binomiale négative ou Tweedie capture la variance supplémentaire plus proprement.

Approche de modélisation

Trois familles de modélisation sur le même découpage 80/20. Toutes entraînées avec offset = log(exposure) pour la fréquence, et la gravité restreinte aux sinistres positifs. Les prédictions de prime pure sont produites sur l'ensemble de test en combinant fréquence et gravité quand elles vivent dans des modèles séparés, ou directement quand elles ne le font pas.

1. GLM Poisson + Gamma (référence du secteur)

La décomposition actuarielle classique : modéliser la fréquence des sinistres avec un Poisson GLM (lien log, offset d'exposition) et la gravité conditionnelle avec un Gamma GLM sur les sinistres positifs. Prime pure = E[N|X] / exposure × E[Y|X, N≥1]. Facile à interpréter coefficient par coefficient ; facile à consommer pour le moteur de tarification ; facile à expliquer à un régulateur.

2. GLM Tweedie Poisson-composé

Un seul modèle sur la cible « prime pure par unité d'exposition » avec une distribution Tweedie(var_power=1.5) et lien log. Gère l'inflation de zéros et la queue positive en un seul ajustement. Expose une histoire plus propre : un seul jeu de coefficients sur la même réponse. Le compromis est que fréquence et gravité ne sont plus modélisées séparément, donc un coefficient ne peut plus se décomposer en « ce conducteur a plus de chances de déclarer » vs. « ce conducteur déclare des sinistres plus gros ».

3. Régression gradient boostée (concurrent)

Une paire de modèles GradientBoostingRegressor: un sur la fréquence par unité d'exposition, un sur la log-gravité — multipliés pour donner la prime pure. Aucune contrainte de monotonie (un système de production en ajouterait sur bonus_malus), aucun prior d'interaction. L'objectif est de voir ce que la famille de méthodes capte que les GLM ratent.

Résultats

Validation 80/20. Deux métriques :

ModèleGini (PP)Lift décile sup.
GLM Tweedie (var_power = 1,5)0.3102.52
GLM Poisson + Gamma0.2412.66
GBM (Poisson + Gamma)0.2111.45
Courbes de Lorenz pour Tweedie, Poisson+Gamma et GBM
Figure 2. Courbes de Lorenz sur l'ensemble de test. La diagonale est la référence aléatoire. Plus la courbe s'incurve sous la diagonale, mieux le modèle concentre les pertes dans les polices les moins risquées (et de manière équivalente, mieux il concentre le risque prédit dans les polices à plus forte sinistralité). Tweedie passe globalement sous Poisson + Gamma, mais les GLM se croisent en haut à droite — exactement la région à laquelle le lift du décile supérieur est sensible.
Deux métriques, deux gagnants. Tweedie capte davantage du signal d'ordonnancement sur l'ensemble du portefeuille (Gini), donc il tariferait mieux en moyenne. Mais Poisson + Gamma identifie plus nettement l'extrême queue supérieure (lift du décile supérieur 2,66 vs 2,52 pour Tweedie), donc il oriente plus correctement vers le palier de tarification le plus élevé. Quel modèle « gagne » dépend de la consommation continue du score par le moteur de tarification ou de sa segmentation par paliers — et de quel palier compte le plus.

Compromis

Esquisse de déploiement

Pour le moteur de tarification et l'équipe actuarielle :

Leçons

  1. Choisissez la métrique que votre consommateur aval utilise réellement, puis choisissez le modèle. Tweedie gagne sur le Gini global ; Poisson + Gamma gagne sur le lift du décile supérieur. Si votre moteur de tarification segmente par paliers, la bonne réponse n'est pas le modèle au Gini le plus élevé.
  2. Une surdispersion légère ne rend pas Tweedie obligatoire. Var/Moy = 1,083 signifie que Poisson n'est pas mal spécifié. La victoire de Tweedie est réelle mais modeste ; le vrai différenciateur est l'adéquation à la philosophie de modélisation (un modèle vs. deux).
  3. Les GLM battent toujours le ML non contraint sur ce type de données. Sans priors de monotonie et régularisation des variables, un GBM est structurellement trop flexible pour le ratio signal/bruit de l'assurance auto. Le bon déploiement ML dans ce domaine est le boosting à contraintes monotones plus la calibration — la version non contrainte est un point de recherche, pas un gain de production.