PRIX SCOR : Le contrôle et la transparence des modèles complexes en actuariat

5 janvier 2021  | Par Dimitri DELCAILLAU
L'actuariel // Métier // Recherche // PRIX SCOR : Le contrôle et la transparence des modèles complexes en actuariat

PRIX SCOR Jeunes Actuaires

Après un double cursus à l’Euria et l’IMT Atlantique, Dimitri Delcaillau a soutenu son mémoire portant sur « le contrôle et la transparence des modèles complexes en actuariat » en 2019.

L’avènement du digital amène les industries à utiliser de manière systématique les données qu’elles collectent. À ces données, parfois d’un format non structuré, sont associées de nouvelles méthodologies : réseaux convolutifs, boosting, etc. pour tirer profit au maximum des informations extraites. Souvent associées à des « boîtes-noires » ces méthodes questionnent sur leur transparence et leur interprétation. Le gain potentiel en termes d’efficacité de ces outils complexes se fait généralement au détriment de la lisibilité conduisant à un compromis précision-interprétabilité. Le contexte réglementaire amène à s’interroger sur ces algorithmes afin de comprendre leurs risques et ainsi mieux les maîtriser. Nos travaux sont ainsi consacrés à la mise en place de méthodes actuarielles dans un contexte de tarification automobile, avec la comparaison d’un modèle dit transparent (GLM) et d’un modèle de type boîte-noire (XGBoost) que ce soit en termes de performance et d’interprétabilité.

L’amélioration des performances dans un marché concurrentiel

Ces modèles complexes de machine learning, comme le deep learning, présentent des performances séduisantes. Appliquées à l’actuariat, ces « boîtes-noires » peuvent fournir une explication plus fine de la sinistralité et sont capables de mieux capter la complexité du phénomène étudié.  L’utilisation de ces « boîtes noires » semble devenir cruciale pour les acteurs de l’assurance qui doivent faire face à une concurrence accrue depuis quelques années, avec notamment les GAFA qui souhaitent intégrer le secteur de l’assurance ainsi que les assurtechs qui bouleversent le marché. Néanmoins, ces modèles complexes demeurent peu déployés en pratique chez les différents acteurs. En dehors des problématiques opérationnelles, le manque de transparence est l’un des principaux éléments justifiant la non mise en production de telles méthodes. La transparence est en effet primordiale dans le métier d’actuaire et est renforcée par le cadre réglementaire, par l’ACPR et le RGPD notamment.

Le machine learning interprétable

Pour faire face à ce souci de transparence auquel de nombreux acteurs sont confrontés, les recherches sur le machine learning interprétable (IML) ont explosé ces dernières années. Une première étape de l’étude consistait donc à un état des lieux des nombreuses méthodes d’interprétation disponibles et de la sélection des outils mathématiques pertinents pour notre application actuarielle. Nous nous sommes restreints aux méthodes d’interprétabilité post-hoc, i.e. une fois le modèle ajusté, et agnostiques, i.e. indépendante du modèle.

Une tarification, via machine Learning, « transparente »

Une telle tarification d’une assurance RC automobile nécessite un retraitement préalable des données lorsqu’un GLM est utilisé. Cette contrainte n’est pas nécessaire avec des modèles comme le XGBoost, capables des modéliser des phénomènes complexes non-linéaires. Le second avantage de ces « boîtes-noires » réside dans l’amélioration des performances, en particulier sur la modélisation fréquentielle des sinistres. Enfin, les différentes méthodes d’interprétation appliquées sur le XGBoost nous a permis de justifier sa transparence ; que ce soit par le biais de l’importance des variables pour comprendre quelles features jouent un rôle prépondérant au sein du modèle, ou par le graphique de dépendance partielle (PDP) pour analyser le rôle marginal moyen de chaque variable ou enfin par SHAP et Lime pour une analyse locale, qui permettent d’obtenir une interprétation de chaque prédiction du modèle, au même titre qu’un GLM.

Biographie

Dimitri DELCAILLAU

Prix SCOR Jeunes actuaires 2020, ingénieur et actuaire, consultant non-vie chez Milliman, membre associé de l’Institut des actuaires.

Connexion