Accéder au contenu principal

IA et risque de crédit bancaire : comprendre le Safe-Tail Paradox

Comment l'IA pourrait-elle déplacer une partie du risque de crédit vers les emprunteurs les mieux notés ?

L'intelligence artificielle est généralement analysée par les banques comme un levier de performance ou comme une source de risques internes : risque modèle, cyber, conformité ou dépendance technologique. Dans leur working paper intitulé « The Safe-Tail Paradox: Stress Testing AI Exposure of Banks' Borrowers », Christophe Hurlin, professeur d'économie, et Christophe Pérignon, professeur de finance, proposent un autre regard : l'intelligence artificielle  pourrait également devenir un facteur externe de risque de crédit, transmis par l'évolution des revenus des emprunteurs. Leur analyse met en évidence un paradoxe : les profils historiquement considérés comme les plus sûrs peuvent aussi concentrer une exposition plus élevée aux transformations liées à l'IA. 

En résumé

  • Un nouvel angle d'analyse. L'IA peut affecter le bilan d'une banque sans provenir de ses propres systèmes : elle peut modifier les trajectoires professionnelles et les revenus de certains emprunteurs. 
  • Un paradoxe contre-intuitif. Les caractéristiques historiquement associées aux meilleurs profils de crédit (revenus élevés, emploi stable, qualification importante) peuvent également être associées à une exposition accrue aux transformations liées à l'IA. 
  • Une rupture méthodologique. Les auteurs proposent un stress test granulaire, dans lequel le choc varie selon l'exposition professionnelle de chaque emprunteur. 
  • Un résultat à instruire. Dans le portefeuille synthétique étudié, l'ajustement relatif des exigences de capital est environ six fois plus élevé dans la classe la mieux notée que dans la classe la moins bien notée. Ce résultat ne constitue cependant pas un diagnostic sur le niveau actuel de capital des banques françaises. 

La Chaire AI for Business Innovation

La Chaire AI for Business Innovation rapproche recherche académique et pratique opérationnelle afin d'explorer les conditions d'une IA performante, responsable et créatrice de valeur. Le working paper de Christophe Hurlin et Christophe Pérignon propose une lecture originale des risques liés à l'IA : non plus seulement comme un enjeu interne aux banques, mais comme un facteur externe susceptible de modifier progressivement le profil de risque de leurs emprunteurs. 

Christophe Hurlin

Professeur d'économie à l'Université d'Orléans, directeur du Laboratoire d'Économie d'Orléans et membre senior de l'Institut Universitaire de France

Christophe Pérignon

Professeur de finance, Deloitte Chair in AI for Business Innovation et Doyen Associé Recherche à HEC Paris

Richard Eudes

Directeur IA & Data chez Deloitte France

Un angle mort potentiel du risque de crédit

Pourquoi traiter l'IA comme un facteur externe de risque de crédit ?

Christophe Pérignon : L'intelligence artificielle est le plus souvent abordée comme un enjeu interne aux opérations et aux obligations réglementaires de la banque. Notre étude part d'une observation différente : elle peut également devenir un facteur externe de risque de crédit, transmis par les trajectoires de revenus des emprunteurs.

Le mécanisme passe par le revenu, qui constitue un déterminant essentiel de la capacité de remboursement d’un crédit immobilier. Le lien entre choc de revenu et défaut est bien documenté. Dans une analyse publiée en 2019, le Haut Conseil de stabilité financière (HCSF) applique un scénario adverse de hausse immédiate de 3 points du taux de chômage global en France. Dans ce cadre, le taux d’encours en défaut sur les prêts immobiliers progresse à long terme de 1,46 % à 1,59 %, soit une hausse relative proche de 9 %.

L'ampleur des effets liés à l'IA reste aujourd'hui incertaine. C'est précisément pour cette raison qu'une approche de stress testing est utile : elle ne vise pas à prévoir un scénario central, mais à examiner un scénario adverse plausible afin d'en apprécier les conséquences.

Christophe Hurlin : La particularité d'un choc technologique lié à l'IA tient à son hétérogénéité. Il ne touche pas nécessairement les mêmes populations que les ralentissements économiques traditionnels. Certaines occupations qualifiées et intensives en tâches cognitives peuvent être davantage exposées que d'autres. Or, dans le cadre étudié, ces profils sont davantage représentés parmi les emprunteurs historiquement considérés comme les plus sûrs.


Qu'est-ce que le Safe-Tail Paradox ?

Christophe Hurlin : L'idée peut se résumer en une phrase : les emprunteurs que les modèles de scoring notent comme les plus sûrs peuvent aussi être parmi les plus exposés à certaines perturbations de revenu induites par l'IA.

Dans les données occupationnelles mobilisées dans notre étude, l'exposition à l'IA tend à augmenter avec le salaire et avec l'intensité cognitive des tâches. Des développeurs, analystes financiers, juristes ou consultants présentent souvent des caractéristiques historiquement associées à un faible risque de défaut : revenu élevé, emploi stable et ratio dette-revenu maîtrisé. Ces caractéristiques les conduisent vers les meilleures classes de notation.

Christophe Pérignon : Le paradoxe ne signifie pas que les modèles de scoring sont mal construits. Ils peuvent rester correctement calibrés sur les historiques de défaut et devenir néanmoins incomplets lorsque l'environnement change. L'exposition professionnelle à l'IA n'est généralement pas intégrée comme variable explicite dans ces modèles. Cette omission n'est pas nécessairement neutre : elle peut se concentrer précisément dans certaines classes considérées comme sûres.

Comment l'IA pourrait affecter la capacité de remboursement

Par quels canaux l'exposition à l'IA pourrait-elle se transmettre aux emprunteurs ?

Christophe Hurlin : Nous modélisons délibérément le versant adverse du choc. Il s'agit d'un choix de stress test, non d'un jugement général sur les effets économiques de l'IA.

Pour de nombreux travailleurs, l'IA peut accroître la productivité, élargir les possibilités professionnelles et soutenir la croissance de leurs entreprises. Les travaux récents menés sur des données françaises montrent d'ailleurs que l'adoption de l'IA peut être associée, en moyenne, à une progression de l'emploi et des ventes dans les entreprises concernées, avec des effets variables selon les usages.

Mais la question pertinente pour une direction des risques n'est pas seulement celle de l'effet moyen. Il faut également examiner la queue de distribution : existe-t-il une population d'emprunteurs dont les revenus pourraient être suffisamment affectés pour modifier leur capacité de remboursement ?

Christophe Pérignon : Notre cadre retient deux canaux. Le premier est celui de l’emploi : perte d’emploi, mobilité contrainte ou déclassement professionnel dans les activités où une part significative des tâches peut être automatisée. Des travaux récents menés aux États-Unis documentent des premiers signaux sur certaines populations : les jeunes travailleurs dans les occupations les plus exposées ont connu une baisse relative de l’emploi, après contrôle des chocs au niveau de l’entreprise. Le second canal est celui des salaires : certaines trajectoires de revenu pourraient subir une pression à la baisse lorsque des tâches deviennent plus facilement réplicables par des systèmes d’IA.

L'exposition à l'IA ne doit pas être confondue avec la matérialisation effective du risque. Deux personnes exerçant une profession comparable peuvent connaître des évolutions très différentes selon leur capacité d'adaptation, les choix de leur employeur ou l'organisation de leur travail. Le stress test vise à explorer une vulnérabilité potentielle, non à prédire une trajectoire individuelle.


Cette exposition peut-elle créer une nouvelle forme de concentration dans les portefeuilles ?

Christophe Pérignon : C'est l'une des implications importantes du paradoxe. Les banques surveillent déjà différentes formes de concentration : sectorielle, géographique ou par type de contrepartie. L'exposition à l'IA pourrait ajouter une dimension supplémentaire.

Des emprunteurs apparemment diversifiés au regard des variables traditionnelles peuvent partager une vulnérabilité commune lorsque leurs activités reposent sur des tâches comparables. Cette exposition technologique peut rester partiellement invisible dans les modèles de scoring et être insuffisamment représentée dans les calibrations usuelles.

Le portefeuille peut donc être moins diversifié qu'il n'y paraît dans certaines classes de notation. L'objectif n'est pas d'affirmer que ce risque est déjà matérialisé, mais de vérifier si les outils existants permettent correctement de le représenter.

Pourquoi un stress test granulaire change l'analyse

En quoi votre approche diffère-t-elle des stress tests bancaires classiques ?

Christophe Hurlin : Les stress tests classiques reposent généralement sur un scénario macroéconomique : évolution du PIB, chômage, taux d'intérêt ou prix immobiliers. Des modèles satellites distribuent ensuite ce choc à travers les portefeuilles.

Cette architecture est adaptée à de nombreux risques macro-financiers. Mais elle n'est pas nécessairement conçue pour détecter une perturbation qui varie fortement d'un emprunteur à l'autre selon le contenu en tâches de son occupation, y compris au sein d'une même classe de notation.

Notre approche introduit un choc au niveau de l'emprunteur. Chaque emprunteur se voit attribuer une exposition professionnelle à l'IA. Le scénario n'est donc plus seulement un choc moyen transmis du macro vers le micro : il résulte de la distribution granulaire des expositions individuelles à travers le portefeuille.

Pourquoi utiliser un portefeuille synthétique calibré sur le marché français ?

Christophe Pérignon : Le portefeuille synthétique est un instrument analytique. Il ne mesure pas directement le risque d'un portefeuille bancaire réel. Il permet d'identifier proprement un mécanisme à partir de deux conditions structurantes : l'exposition à l'IA est corrélée à certaines caractéristiques historiquement associées à la solvabilité et les modèles de scoring n'intègrent pas explicitement cette dimension.

Ce choix répond également à une contrainte de données. À notre connaissance, il n’existe pas de base publique croisant de manière suffisamment granulaire le revenu d’un emprunteur, son type de contrat, les caractéristiques de son crédit et le contenu en tâches de son occupation.

Pour tester le mécanisme sur un portefeuille effectif, une banque pourrait commencer par rapprocher les informations professionnelles disponibles dans ses dossiers avec des indices d'exposition occupationnelle à l'IA. Elle pourrait ensuite conduire des analyses de sensibilité, examiner la distribution des expositions au sein des classes de notation et tester différents scénarios de transmission vers les revenus et les probabilités de défaut.

La disponibilité, la qualité et la granularité des données doivent être évaluées établissement par établissement. L'objectif initial n'est pas nécessairement de modifier les modèles d'octroi, mais de déterminer si un angle mort matériel existe.

Ce que les banques peuvent instruire dès maintenant

Quels enseignements une direction des risques doit-elle retenir ?

Christophe Hurlin : Le principal enseignement porte sur la localisation du risque le long de l'échelle de notation.

Dans notre portefeuille synthétique et sous les hypothèses de calibration retenues, l'intégration du choc au niveau d'exposition déjà observable élève les probabilités de défaut (PD) d'environ 36 % dans la classe la mieux notée, contre 8 % dans la classe la moins bien notée. La variation relative est donc environ quatre à cinq fois plus élevée dans la première classe.

Lorsque ces évolutions sont traduites en exigences de capital par la formule IRB (Internal Ratings Based) standard, l'asymétrie s'amplifie : l'ajustement relatif est d'environ 25 % dans la classe la mieux notée, contre 4 % dans la classe la moins bien notée, soit un ratio proche de six. Cette amplification tient à la sensibilité locale de la formule prudentielle aux variations de PD lorsque les probabilités de défaut initiales sont faibles.

Ces chiffres ne constituent pas une estimation de la situation actuelle des banques françaises. Ils dépendent du portefeuille étudié, des indices d'exposition et des hypothèses du stress test. En revanche, le signe du résultat est structurel dans notre cadre : le choc potentiel frappe proportionnellement plus fortement les classes où les coussins de capital sont initialement les plus minces.

Pour une banque, trois axes de travail peuvent être envisagés :

  1. Évaluer les données disponibles : examiner la disponibilité, la qualité et la granularité des informations professionnelles relatives aux emprunteurs.
  2. Cartographier les expositions : conduire des analyses exploratoires en rapprochant ces informations d'indices d'exposition occupationnelle à l'IA.
  3. Tester la matérialité : enrichir les exercices internes de stress testing afin d'identifier d'éventuelles concentrations intra-classe et d'organiser la gouvernance du sujet entre crédit, risques, modèles, capital et data.

Selon les résultats obtenus, le sujet pourrait ensuite être instruit dans différents cadres : suivi des risques émergents, Model Risk Management, stress tests internes, processus d'évaluation de l'adéquation du capital interne (ICAAP) ou dialogue prudentiel. Il serait prématuré d'en déduire automatiquement une réponse unique. Le premier enjeu est de rendre le risque visible et de le mesurer correctement.

Quel message adresser à un comité exécutif de banque ? 

Christophe Pérignon : L'IA invite les banques à regarder là où les modèles historiques regardent le moins : dans certaines classes d'emprunteurs considérées comme les plus sûres. 

Ce n'est pas une prévision sur l'avenir de l'IA, ni une conclusion sur le niveau actuel de capital des banques. C'est une invitation à examiner un angle mort potentiel avant que ses éventuels effets ne deviennent visibles dans les historiques de défaut. 

La logique prudentielle consiste précisément à anticiper, et non à attendre que le risque se matérialise. 

  • Christophe Hurlin et Christophe Pérignon, The Safe-Tail Paradox: Stress Testing AI Exposure of Banks' Borrowers, SSRN Working Paper, 2026. 
  • Haut Conseil de stabilité financière, Diagnostic des risques dans le secteur de l'immobilier résidentiel, 2019. 
  • Erik Brynjolfsson, Bharat Chandar et Ruyu Chen, Canaries in the Coal Mine? Six Facts about the Recent Employment Effects of Artificial Intelligence, Stanford Digital Economy Lab, 2025. 
  • Philippe Aghion et al., How Different Uses of AI Shape Labor Demand: Evidence from France, AEA Papers and Proceedings, 2025. 
  • Maxim Massenkoff et Peter McCrory, Labor Market Impacts of AI: A New Measure and Early Evidence, Anthropic, 2026. 
  • Tyna Eloundou et al., GPTs Are GPTs: Labor Market Impact Potential of LLMs, Science, 2024. 

 

Pour aller plus loin : 

  • Bank of England, Financial Policy Committee Record, avril 2026. 
  • Financial Stability Oversight Council, 2025 Annual Report. 
  • Coface, The Next Automation Frontier: A Scenario Map of AI Labour Exposure, avril 2026. 

Questions fréquentes 

Qu'est-ce que le Safe-Tail Paradox

Le Safe-Tail Paradox désigne une situation dans laquelle certains emprunteurs historiquement considérés comme peu risqués peuvent être davantage exposés à un facteur émergent de vulnérabilité : les effets potentiels de l'IA sur leurs trajectoires professionnelles et leurs revenus. 

Les modèles de scoring bancaires sont-ils devenus obsolètes ? 

Non. Les modèles peuvent rester correctement calibrés sur les historiques de défaut tout en restant incomplets face à un facteur exogène nouveau qui n'était pas représenté dans les données utilisées pour les construire. 

En quoi un stress test IA diffère-t-il d'un stress test classique ? 

Un stress test classique repose généralement sur des variables macroéconomiques agrégées. Le cadre proposé par les auteurs introduit une exposition professionnelle différenciée pour chaque emprunteur afin d'étudier l'hétérogénéité du choc à l'intérieur des portefeuilles. 

Le mécanisme se limite-t-il au crédit immobilier ? 

Non. Le crédit immobilier résidentiel constitue le cas étudié. Mais le mécanisme peut également être pertinent pour d'autres segments dans lesquels le scoring s'appuie fortement sur le revenu, la qualification ou le type d'emploi. Ces extensions doivent être instruites spécifiquement. 

Que peuvent faire les banques à court terme ? 

Elles peuvent commencer par évaluer la disponibilité et la qualité de leurs données professionnelles, cartographier les expositions occupationnelles pertinentes et conduire des analyses exploratoires de sensibilité. Toute évolution des modèles ou du traitement prudentiel suppose ensuite une analyse de matérialité sur données réelles. 

Avez-vous trouvé cela utile ?

Merci pour votre retour