L'intelligence artificielle est généralement analysée par les banques comme un levier de performance ou comme une source de risques internes : risque modèle, cyber, conformité ou dépendance technologique. Dans leur working paper intitulé « The Safe-Tail Paradox: Stress Testing AI Exposure of Banks' Borrowers », Christophe Hurlin, professeur d'économie, et Christophe Pérignon, professeur de finance, proposent un autre regard : l'intelligence artificielle pourrait également devenir un facteur externe de risque de crédit, transmis par l'évolution des revenus des emprunteurs. Leur analyse met en évidence un paradoxe : les profils historiquement considérés comme les plus sûrs peuvent aussi concentrer une exposition plus élevée aux transformations liées à l'IA.
S’ouvre dans une nouvelle fenêtre
Christophe Pérignon : L'intelligence artificielle est le plus souvent abordée comme un enjeu interne aux opérations et aux obligations réglementaires de la banque. Notre étude part d'une observation différente : elle peut également devenir un facteur externe de risque de crédit, transmis par les trajectoires de revenus des emprunteurs.
Le mécanisme passe par le revenu, qui constitue un déterminant essentiel de la capacité de remboursement d’un crédit immobilier. Le lien entre choc de revenu et défaut est bien documenté. Dans une analyse publiée en 2019, le Haut Conseil de stabilité financière (HCSF) applique un scénario adverse de hausse immédiate de 3 points du taux de chômage global en France. Dans ce cadre, le taux d’encours en défaut sur les prêts immobiliers progresse à long terme de 1,46 % à 1,59 %, soit une hausse relative proche de 9 %.
L'ampleur des effets liés à l'IA reste aujourd'hui incertaine. C'est précisément pour cette raison qu'une approche de stress testing est utile : elle ne vise pas à prévoir un scénario central, mais à examiner un scénario adverse plausible afin d'en apprécier les conséquences.
Christophe Hurlin : La particularité d'un choc technologique lié à l'IA tient à son hétérogénéité. Il ne touche pas nécessairement les mêmes populations que les ralentissements économiques traditionnels. Certaines occupations qualifiées et intensives en tâches cognitives peuvent être davantage exposées que d'autres. Or, dans le cadre étudié, ces profils sont davantage représentés parmi les emprunteurs historiquement considérés comme les plus sûrs.
Christophe Hurlin : L'idée peut se résumer en une phrase : les emprunteurs que les modèles de scoring notent comme les plus sûrs peuvent aussi être parmi les plus exposés à certaines perturbations de revenu induites par l'IA.
Dans les données occupationnelles mobilisées dans notre étude, l'exposition à l'IA tend à augmenter avec le salaire et avec l'intensité cognitive des tâches. Des développeurs, analystes financiers, juristes ou consultants présentent souvent des caractéristiques historiquement associées à un faible risque de défaut : revenu élevé, emploi stable et ratio dette-revenu maîtrisé. Ces caractéristiques les conduisent vers les meilleures classes de notation.
Christophe Pérignon : Le paradoxe ne signifie pas que les modèles de scoring sont mal construits. Ils peuvent rester correctement calibrés sur les historiques de défaut et devenir néanmoins incomplets lorsque l'environnement change. L'exposition professionnelle à l'IA n'est généralement pas intégrée comme variable explicite dans ces modèles. Cette omission n'est pas nécessairement neutre : elle peut se concentrer précisément dans certaines classes considérées comme sûres.
Christophe Hurlin : Nous modélisons délibérément le versant adverse du choc. Il s'agit d'un choix de stress test, non d'un jugement général sur les effets économiques de l'IA.
Pour de nombreux travailleurs, l'IA peut accroître la productivité, élargir les possibilités professionnelles et soutenir la croissance de leurs entreprises. Les travaux récents menés sur des données françaises montrent d'ailleurs que l'adoption de l'IA peut être associée, en moyenne, à une progression de l'emploi et des ventes dans les entreprises concernées, avec des effets variables selon les usages.
Mais la question pertinente pour une direction des risques n'est pas seulement celle de l'effet moyen. Il faut également examiner la queue de distribution : existe-t-il une population d'emprunteurs dont les revenus pourraient être suffisamment affectés pour modifier leur capacité de remboursement ?
Christophe Pérignon : Notre cadre retient deux canaux. Le premier est celui de l’emploi : perte d’emploi, mobilité contrainte ou déclassement professionnel dans les activités où une part significative des tâches peut être automatisée. Des travaux récents menés aux États-Unis documentent des premiers signaux sur certaines populations : les jeunes travailleurs dans les occupations les plus exposées ont connu une baisse relative de l’emploi, après contrôle des chocs au niveau de l’entreprise. Le second canal est celui des salaires : certaines trajectoires de revenu pourraient subir une pression à la baisse lorsque des tâches deviennent plus facilement réplicables par des systèmes d’IA.
L'exposition à l'IA ne doit pas être confondue avec la matérialisation effective du risque. Deux personnes exerçant une profession comparable peuvent connaître des évolutions très différentes selon leur capacité d'adaptation, les choix de leur employeur ou l'organisation de leur travail. Le stress test vise à explorer une vulnérabilité potentielle, non à prédire une trajectoire individuelle.
Christophe Pérignon : C'est l'une des implications importantes du paradoxe. Les banques surveillent déjà différentes formes de concentration : sectorielle, géographique ou par type de contrepartie. L'exposition à l'IA pourrait ajouter une dimension supplémentaire.
Des emprunteurs apparemment diversifiés au regard des variables traditionnelles peuvent partager une vulnérabilité commune lorsque leurs activités reposent sur des tâches comparables. Cette exposition technologique peut rester partiellement invisible dans les modèles de scoring et être insuffisamment représentée dans les calibrations usuelles.
Le portefeuille peut donc être moins diversifié qu'il n'y paraît dans certaines classes de notation. L'objectif n'est pas d'affirmer que ce risque est déjà matérialisé, mais de vérifier si les outils existants permettent correctement de le représenter.
Christophe Hurlin : Les stress tests classiques reposent généralement sur un scénario macroéconomique : évolution du PIB, chômage, taux d'intérêt ou prix immobiliers. Des modèles satellites distribuent ensuite ce choc à travers les portefeuilles.
Cette architecture est adaptée à de nombreux risques macro-financiers. Mais elle n'est pas nécessairement conçue pour détecter une perturbation qui varie fortement d'un emprunteur à l'autre selon le contenu en tâches de son occupation, y compris au sein d'une même classe de notation.
Notre approche introduit un choc au niveau de l'emprunteur. Chaque emprunteur se voit attribuer une exposition professionnelle à l'IA. Le scénario n'est donc plus seulement un choc moyen transmis du macro vers le micro : il résulte de la distribution granulaire des expositions individuelles à travers le portefeuille.
Dans ce type d'exercice, l'hétérogénéité n'est pas seulement transmise par le scénario, elle devient le scénario.
Christophe Pérignon : Le portefeuille synthétique est un instrument analytique. Il ne mesure pas directement le risque d'un portefeuille bancaire réel. Il permet d'identifier proprement un mécanisme à partir de deux conditions structurantes : l'exposition à l'IA est corrélée à certaines caractéristiques historiquement associées à la solvabilité et les modèles de scoring n'intègrent pas explicitement cette dimension.
Ce choix répond également à une contrainte de données. À notre connaissance, il n’existe pas de base publique croisant de manière suffisamment granulaire le revenu d’un emprunteur, son type de contrat, les caractéristiques de son crédit et le contenu en tâches de son occupation.
Pour tester le mécanisme sur un portefeuille effectif, une banque pourrait commencer par rapprocher les informations professionnelles disponibles dans ses dossiers avec des indices d'exposition occupationnelle à l'IA. Elle pourrait ensuite conduire des analyses de sensibilité, examiner la distribution des expositions au sein des classes de notation et tester différents scénarios de transmission vers les revenus et les probabilités de défaut.
La disponibilité, la qualité et la granularité des données doivent être évaluées établissement par établissement. L'objectif initial n'est pas nécessairement de modifier les modèles d'octroi, mais de déterminer si un angle mort matériel existe.
Christophe Hurlin : Le principal enseignement porte sur la localisation du risque le long de l'échelle de notation.
Dans notre portefeuille synthétique et sous les hypothèses de calibration retenues, l'intégration du choc au niveau d'exposition déjà observable élève les probabilités de défaut (PD) d'environ 36 % dans la classe la mieux notée, contre 8 % dans la classe la moins bien notée. La variation relative est donc environ quatre à cinq fois plus élevée dans la première classe.
Lorsque ces évolutions sont traduites en exigences de capital par la formule IRB (Internal Ratings Based) standard, l'asymétrie s'amplifie : l'ajustement relatif est d'environ 25 % dans la classe la mieux notée, contre 4 % dans la classe la moins bien notée, soit un ratio proche de six. Cette amplification tient à la sensibilité locale de la formule prudentielle aux variations de PD lorsque les probabilités de défaut initiales sont faibles.
Ces chiffres ne constituent pas une estimation de la situation actuelle des banques françaises. Ils dépendent du portefeuille étudié, des indices d'exposition et des hypothèses du stress test. En revanche, le signe du résultat est structurel dans notre cadre : le choc potentiel frappe proportionnellement plus fortement les classes où les coussins de capital sont initialement les plus minces.
Pour une banque, trois axes de travail peuvent être envisagés :
Selon les résultats obtenus, le sujet pourrait ensuite être instruit dans différents cadres : suivi des risques émergents, Model Risk Management, stress tests internes, processus d'évaluation de l'adéquation du capital interne (ICAAP) ou dialogue prudentiel. Il serait prématuré d'en déduire automatiquement une réponse unique. Le premier enjeu est de rendre le risque visible et de le mesurer correctement.
Christophe Pérignon : L'IA invite les banques à regarder là où les modèles historiques regardent le moins : dans certaines classes d'emprunteurs considérées comme les plus sûres.
Ce n'est pas une prévision sur l'avenir de l'IA, ni une conclusion sur le niveau actuel de capital des banques. C'est une invitation à examiner un angle mort potentiel avant que ses éventuels effets ne deviennent visibles dans les historiques de défaut.
La logique prudentielle consiste précisément à anticiper, et non à attendre que le risque se matérialise.