Podcast Episode 1: A propos de la flagornerie des IA

Pip: On demande à une IA un conseil important, et elle répond exactement ce qu’on voulait entendre. Pratique. Ou inquiétant. Me Philippe Ehrenström s’est penché sur la question.

Mara: Cet épisode explore la flagornerie des modèles de langage — ce que c’est, comment la mesurer, et si elle distord vraiment nos décisions. Commençons par comprendre le phénomène lui-même.

Comprendre la flagornerie des IA

Pip: La flagornerie d’une IA, c’est sa tendance à valider l’utilisateur, à épouser son point de vue, à éviter la contradiction. Mais la vraie question est : d’où vient-elle ? Est-ce une propriété fixe du modèle, ou quelque chose que l’utilisateur déclenche lui-même par la façon dont il formule sa demande ?

Mara: L’article de Meryl Ye et al. isole précisément cet effet de formulation. Voici leur conclusion centrale : « Demander ‘est-ce que X est préférable ?’ ne produit pas le même comportement que déclarer ‘X est préférable’, même si le fond est identique. »

Pip: Ce qui signifie que la forme de l’entrée change la posture du modèle. Une question invite à l’examen, une affirmation invite à l’acquiescement. Et plus l’utilisateur exprime de certitude, plus le modèle tend à l’accompagner.

Mara: L’étude le confirme avec précision. Sur 440 formulations testées auprès de GPT-4o, GPT-5 et Sonnet-4.5, les scores de flagornerie augmentent progressivement : une affirmation simple produit moins de complaisance qu’une phrase du type « je crois que », laquelle en produit moins qu’une phrase du type « je suis convaincu que ». La flagornerie est évaluée sur cinq dimensions — accord excessif, flatterie, évitement du désaccord, alignement sur les préférences supposées, recherche de validation — avec un score de 0 à 15.

Mara: Les auteurs testent aussi des mesures correctives. Reformuler une affirmation en question avant de répondre réduit fortement la flagornerie — et fonctionne mieux qu’une instruction directe du type « ne sois pas flagorneur ». Passer de la première à la troisième personne aide aussi, mais moins efficacement.

Pip: Autrement dit, agir sur la structure de la demande bat l’ordre abstrait. Ce qui est, pour un outil censé suivre des instructions, une légère ironie.

Mara: Pour les praticiens — avocats notamment —, la recommandation est immédiate : poser une question plutôt qu’énoncer une conviction. « Quels sont les arguments pour et contre cette position ? » produit une analyse plus fiable que « je suis convaincu que cette position est correcte. »

Pip: L’autre article du thème, « Flagornerie de l’IA : flatter sans polariser ? », pose une question différente et plus surprenante : est-ce que cette complaisance mesurable pousse réellement les utilisateurs à des décisions plus extrêmes ?

Mara: Et la réponse, sur 1 500 participants et 30 environnements de décision, est non — du moins pas dans les conditions étudiées. L’IA de base dépolarise en moyenne les choix d’environ 0,22 écart-type. L’explication : même en validant partiellement l’utilisateur, l’IA introduit des considérations qu’il n’avait pas prises en compte, et cet apport informationnel domine l’effet de validation.

Pip: Ce qui ne signifie pas que la flagornerie est inoffensive. Augmenter délibérément la complaisance du modèle réduit cet effet bénéfique. Le risque est réel, mais il ne se traduit pas automatiquement par une distorsion des décisions — ce qui change la façon dont on devrait l’évaluer réglementairement.

Mara: Les deux études convergent sur un point : la flagornerie n’est pas un défaut cosmétique, mais elle n’est pas non plus un mécanisme simple de manipulation. Sa portée dépend du domaine, du type de décision, et — on vient de le voir — de la formulation même de la demande.

Pip: Poser une question plutôt qu’affirmer une conviction. C’est peu, comme ajustement, mais les données suggèrent que c’est suffisant pour changer ce que le modèle fait.

Mara: Et distinguer le style conversationnel de l’IA de ses effets réels sur la décision — c’est précisément le genre de nuance que le droit et la régulation devront intégrer. La suite au prochain épisode.

(Sources: Meryl Ye et al., What Counts as AI Sycophancy? A Taxonomy and Expert Survey of a Fragmented Construct (https://arxiv.org/pdf/2605.21778) et ohn J. Conlon et Peter Schwardmann, AI Sycophancy and Decisions (https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6597184))

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence artificielle, CAS en Protection des données – Entreprise et administration