L’IA plutôt que les travailleurs sociaux pour traiter des sans-abris ?

Quelques éléments de réflexion tirés de G. Pokharel/S.Farabi/P.J.Fowler/S.Das, Street-Level AI : Are Large Language Models Ready for Real-World Judgements ? arXiv :2508.08193v2 [cs.CY], 4 septembre 2025 (https://arxiv.org/html/2508.08193v1):

L’article examine la question suivante : dans quelle mesure des modèles de langage de grande taille peuvent-ils se substituer, partiellement ou totalement, au jugement de terrain des agents publics lorsqu’il s’agit d’allouer des ressources rares, par exemple dans les services aux personnes sans domicile.

Les auteurs testent ces modèles sur des données réelles, en les comparant à la fois aux décisions humaines et aux outils standardisés déjà utilisés pour établir des priorités. Leur conclusion est claire : sans adaptation et sans garde-fous, les résultats des modèles sont instables, souvent incohérents, et mal alignés sur les principes de justice locale qui fondent les pratiques administratives.

L’introduction rappelle que de nombreux travaux confrontent déjà les raisonnements moraux des modèles d’IA à ceux d’êtres humains, souvent au moyen de dilemmes abstraits ou de cas médicaux. Mais la vraie question, insistent les auteurs, est de savoir si ces systèmes peuvent être utilisés pour remplacer ou assister les agents publics de première ligne. Ceux-ci, qualifiés de « street-level bureaucrats », doivent quotidiennement décider qui bénéficie d’une aide et selon quelles priorités. Or ces choix sont encadrés par des normes locales de justice, par exemple la règle du « vulnerability first » qui prévaut dans l’hébergement d’urgence aux États-Unis. L’enjeu n’est donc pas de trancher des dilemmes éthiques généraux, mais de vérifier si les modèles respectent ou non ces principes établis.

Le contexte institutionnel est décrit avec précision. Dans l’aide aux sans-abri, les travailleurs sociaux s’appuient sur des questionnaires standardisés, comme le VI-SPDAT et ses variantes, qui attribuent un score d’acuité en fonction de critères tels que la santé, les antécédents résidentiels ou la durée de vie à la rue. Ces barèmes visent à hiérarchiser les demandes, mais restent critiqués pour leurs biais et leur simplification excessive. En pratique, les agents sociaux disposent toujours d’une marge d’appréciation, et leurs choix ne coïncident pas toujours avec l’ordre suggéré par les outils. Cette situation rend pertinente la question d’une éventuelle substitution par des modèles de langage, d’autant que ceux-ci sont déjà utilisés dans d’autres pans de l’action sociale.

La méthodologie combine deux approches. D’une part, les auteurs reprennent une expérience où des profils de ménages sont comparés par paires, chaque fois avec la consigne de décider lequel doit recevoir une aide plus intensive. Les modèles sont testés dans différentes conditions d’information : avec uniquement les données, uniquement une prédiction de risque, une prédiction produite par le modèle lui-même, ou les deux ensembles d’informations. D’autre part, pour se rapprocher d’un usage administratif réel, ils demandent aux modèles d’établir un classement global de priorités parmi des ménages évalués par le système local. Ce classement est obtenu par agrégation de comparaisons binaires répétées, méthode statistiquement robuste et compatible avec des contraintes de confidentialité.

Les outils de référence sont les versions du VI-SPDAT et un second barème local, le RMFS. Ceux-ci sont stables et largement utilisés, ce qui permet de comparer les productions des modèles à des standards existants. Côté modèles, l’étude inclut plusieurs systèmes connus, ouverts et propriétaires, pour l’expérience par paires, et deux modèles ouverts de taille intermédiaire pour l’expérience locale, sans entraînement supplémentaire afin de simuler un usage « prêt-à-l’emploi ».

Les résultats révèlent d’abord, dans l’expérience par paires, une forte variabilité. Quand seules les données sont fournies, les modèles produisent des décisions dispersées, comme des non-spécialistes confrontés à des tableaux bruts. Lorsqu’ils ne voient que la prédiction de risque, ils adoptent des orientations stables mais divergentes : certains privilégient systématiquement les ménages à faible risque (logique de résultat), d’autres favorisent les plus vulnérables. Dans la condition mixte, leurs choix reflètent surtout la tendance révélée par la prédiction seule, rappelant l’influence observée chez les agents humains lorsqu’on leur présente un score de risque.

Mais c’est dans le classement global que l’écart est le plus net. Les barèmes produisent des ordres très stables d’une exécution à l’autre. Les modèles, eux, génèrent des classements changeants : deux exécutions indépendantes du même modèle corrèlent faiblement, parfois presque pas. Surtout, la correspondance avec les barèmes est quasi nulle, voire négative. Autrement dit, les modèles ne reproduisent pas la hiérarchie institutionnelle voulue par les questionnaires, pourtant conçus pour refléter des choix collectifs de justice locale.

Les auteurs explorent ensuite les critères implicites utilisés par les modèles. En cartographiant les priorités produites sur les réponses aux questionnaires, ils constatent que les variables jugées importantes varient d’une exécution à l’autre. Quelques thèmes reviennent, comme les conditions de logement, mais l’effet associé change de direction, et l’absence de réponse à certaines questions influe parfois plus que les réponses elles-mêmes. Ce manque de cohérence montre que les modèles peinent à stabiliser des règles claires dans un espace décisionnel structuré.

Quand on compare ces classements à la réalité des décisions humaines, mesurée par l’attribution effective de prestations intensives, aucun système ne se montre vraiment prédictif. Le VI-SPDAT fait légèrement mieux pour les adultes seuls, mais ni les barèmes ni les modèles ne captent correctement les pratiques d’allocation pour les familles et les jeunes. Cela tient au fait que les attributions dépendent de nombreux facteurs contingents, tels que la disponibilité des solutions et des considérations pratiques non codées dans les questionnaires. Les modèles, en l’état, n’apportent donc pas d’amélioration notable.

La discussion insiste sur trois points. D’abord, l’instabilité interne des modèles rend leur usage problématique dans des décisions exigeant cohérence et égalité de traitement. Ensuite, le décalage observé avec les barèmes signale que les modèles ne suivent pas les principes de justice locale, mais s’appuient sur des régularités superficielles. Enfin, même lorsqu’on regarde les résultats réels, ils ne se rapprochent pas davantage du jugement professionnel. Les auteurs recommandent donc d’éviter toute substitution directe des travailleurs sociaux par des LLM et d’envisager plutôt des usages hybrides, transparents et contrôlés par des humains.

Pour l’avenir, ils évoquent des pistes d’amélioration, comme l’entraînement sur des données locales, l’intégration d’informations multimodales ou la mise en place de mécanismes de supervision humaine. Mais ils soulignent que la clé reste l’alignement sur les normes de justice locales et la préservation d’un espace de discrétion professionnelle. Leurs conclusions sont prudentes : les modèles peuvent assister, mais non remplacer, et seulement si des garanties procédurales et de responsabilité sont mises en place.

Méthodologiquement, l’étude est robuste : données réelles, respect de la confidentialité, recours à des méthodes d’agrégation solides et vérification de la stabilité des barèmes. Les limites — absence de fine-tuning, taille réduite des modèles pour l’inférence locale — renforcent paradoxalement la pertinence des résultats, car elles reflètent le scénario réaliste d’un usage sans ressources techniques considérables. Pour des praticiens étrangers, l’apport est double : il montre la fragilité d’une approche purement algorithmique dans des politiques sociales, et rappelle la nécessité de maintenir un contrôle juridique et procédural fort.

En somme, l’article met en évidence l’écart entre l’espoir suscité par les LLM et leur performance réelle dans un contexte concret et sensible. Il démontre qu’en l’absence d’encadrement, ces modèles produisent des décisions changeantes et déconnectées des principes établis. Pour les avocats suisses intéressés par l’IA, le message est clair : l’intégration de ces outils dans le droit social ou l’action publique n’est envisageable qu’à condition de tester les modèles dans leur contexte, de définir des critères transparents, et de préserver des voies de supervision et de recours.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans discrimination, Droit US, intelligence artificielle | Tagué , , | Laisser un commentaire

IA et fixation dynamique des prix

Présentation des interactions entre l'IA et du

Quelques réflexions tirées de Victoria Ticha, The rise of dynamic pricing: Should AI decide what you pay? Techxplore 8 septembre 2025 (https://techxplore.com/news/2025-09-dynamic-pricing-ai-pay.html):

L’article analyse la montée en puissance du recours à l’intelligence artificielle pour fixer les prix, en particulier dans les secteurs où le « yield management » et la tarification dynamique étaient déjà installés, comme l’aérien. La nouveauté n’est pas le principe, mais l’ampleur et la précision que permet l’IA grâce à l’exploitation massive de données personnelles et comportementales. Le texte met en évidence les avantages économiques attendus, mais aussi les risques juridiques, concurrentiels et sociétaux qui découlent de cette évolution.

L’auteur illustre d’abord la pratique par l’exemple des billets d’avion : un consommateur consulte un vol aller-retour Sydney–New York, compare brièvement les tarifs en classe affaires, revient ensuite pour acheter en économie et découvre que le prix initial a fortement augmenté. En utilisant un VPN, il constate que les tarifs montent encore. Ce scénario témoigne d’une logique où l’algorithme a détecté une disposition à payer plus, et ajuste le prix en conséquence. Dans ce système, le profil du client, sa localisation, ses recherches antérieures et la temporalité de sa demande deviennent des variables intégrées dans un calcul qui vise à maximiser le revenu de l’entreprise.

Cette logique conduit à un glissement du ciblage marketing classique vers une personnalisation tarifaire systématique. Si, historiquement, les prix évoluaient en fonction de critères agrégés de demande et d’offre, désormais ils peuvent être adaptés en temps réel à chaque individu. Des signaux sensibles tels que le code postal, le niveau de revenu ou même l’historique de crédit peuvent servir de base à la fixation d’un tarif différencié. Une telle granularité soulève immédiatement la question de l’équité. En effet, si deux consommateurs voient des prix distincts pour un produit identique, sans transparence ni justification claire, la perception d’injustice s’installe. Des études citées par l’article rappellent que les consommateurs rejettent massivement les offres perçues comme injustes, même lorsqu’elles leur sont favorables.

Les professeurs cités insistent sur ce risque : maximiser les profits à court terme en exploitant la disposition à payer d’un consommateur peut conduire à une perte durable de confiance. L’argument avancé est simple : si les clients comprennent que leurs données personnelles servent à leur imposer un prix plus élevé que celui offert à d’autres, la relation commerciale est compromise. À long terme, cela peut détruire la fidélité et déclencher des réactions politiques et réglementaires.

La pratique est déjà généralisée dans plusieurs secteurs. L’e-commerce, par exemple Amazon, ajuste ses prix toutes les quelques minutes. Les compagnies aériennes utilisent depuis longtemps le « yield management », et expérimentent aujourd’hui des modèles plus poussés basés sur l’IA, comme l’a montré l’initiative de Delta Airlines de tarification individualisée. Mais la perspective dépasse l’aérien : la distribution alimentaire pourrait aussi en être affectée. Si le prix du pain ou des bananes diffère selon le consommateur, il devient impossible de vérifier l’égalité de traitement. Les anomalies sont plus visibles sur des produits du quotidien, mais sur des achats occasionnels – billets d’avion, hôtels, locations de voitures – le consommateur n’a pas de repère solide, ce qui ouvre la voie à des pratiques discrètes et potentiellement abusives.

Du point de vue économique, la tarification dynamique s’inscrit dans une logique rationnelle. Toute entreprise cherche à capter la disposition maximale à payer. La tarification différenciée existe déjà dans les transports, la restauration ou les services de mobilité. L’exemple type est celui des plateformes de VTC : les prix baissent aux heures creuses et augmentent lors des pics, ce qui assure un équilibre entre l’offre et la demande. Beaucoup de consommateurs acceptent de payer plus cher pour disposer d’un service immédiatement disponible.

Là encore, la justification économique ne suffit pas à écarter les enjeux d’équité. Certains consommateurs ne peuvent supporter les prix de pointe et doivent attendre, avec un coût indirect lié au temps perdu. De plus, des études montrent que certaines catégories de population – personnes âgées, à faibles revenus ou à mobilité réduite – ont moins de capacité à arbitrer entre différents fournisseurs, ce qui peut conduire à des discriminations indirectes. L’IA amplifie ce phénomène en systématisant et en accélérant les ajustements de prix. Grâce aux données massives et à l’apprentissage automatique, il devient possible d’identifier en continu la valeur maximale qu’un individu est prêt à payer et de l’exploiter instantanément.

Cette capacité accentue la tension entre efficacité économique et protection du consommateur. Juridiquement, la situation varie selon les pays. En Australie, la discrimination tarifaire est admise dès lors qu’elle ne repose pas sur des critères prohibés comme la race, le sexe, l’âge ou le handicap, et qu’elle ne fausse pas la concurrence. Toutefois, les autorités de régulation, en particulier la Commission australienne de la concurrence et de la consommation (ACCC), s’inquiètent de l’opacité algorithmique. L’ACCC a d’ailleurs fait de la transparence des algorithmes une priorité en 2025, et le droit de la consommation australien est en cours de révision pour traiter spécifiquement ces questions.

La difficulté est que la régulation est en retard par rapport aux innovations. Les autorités disposent de certaines données, par exemple via l’Office australien de la statistique qui suit les transactions, mais elles manquent de moyens pour détecter en temps réel les abus ou les discriminations illégales. En pratique, l’utilisation des données personnelles repose encore sur un accord implicite : le consommateur accepte de les fournir pour obtenir un service, avec l’idée qu’elles ne seront pas utilisées à son détriment. Si cette confiance est trahie, le risque de contentieux et d’intervention réglementaire augmente.

L’article conclut que la tarification algorithmique assistée par l’IA se situe à la croisée de plusieurs logiques. D’un côté, elle accroît l’efficacité des marchés en ajustant les prix aux préférences et aux contraintes des consommateurs. Elle peut favoriser la fluidité, améliorer la disponibilité des biens et réduire certains coûts en période creuse. De l’autre, elle soulève des enjeux fondamentaux de justice, de transparence et de confiance. Le recours à des signaux personnels pour individualiser les tarifs peut accentuer les inégalités sociales, pénaliser les plus vulnérables et susciter un rejet massif.

Les experts cités s’accordent sur un point : sans encadrement juridique clair et sans garde-fous éthiques, les entreprises risquent de provoquer un retour de bâton. L’histoire des marchés montre que toute stratégie perçue comme abusive finit par se retourner contre son initiateur. L’IA appliquée à la tarification ne fait pas exception : utilisée à mauvais escient, elle peut déclencher une réaction réglementaire sévère, voire des restrictions qui limiteraient ses bénéfices potentiels.

En résumé, l’article met en évidence un dilemme central pour les praticiens: comment concilier l’usage légitime et potentiellement bénéfique des technologies de tarification dynamique avec la nécessité de préserver la confiance du consommateur, de garantir la transparence et d’assurer un cadre équitable et non discriminatoire ? L’expérience australienne, qui reflète des débats similaires aux États-Unis et en Europe, suggère que la régulation va devoir évoluer rapidement pour s’adapter aux réalités d’un marché où les prix ne sont plus seulement fonction de l’offre et de la demande globales, mais aussi du profil intime de chaque acheteur.

(On lira aussi les intéressants commentaires de Fabrizio Degni sur cet article : https://www.linkedin.com/posts/fdegni_artificialintelligence-ai-innovation-activity-7371354248657330176-0QOa?utm_source=share&utm_medium=member_desktop&rcm=ACoAAAX2b5oB2W8RFgEb7aoRz8wscswBHlxf0Mg)

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans intelligence artificielle | Tagué , , , , | Laisser un commentaire

Le labyrinthe de l’opposition au congé

Exigences relatives à l'opposition que doit former l'employé confronté à un licenciement abusif (art. 336b al. 1 CO)

3.  Le recourant se plaint d’une violation de l’art. 336b CO, considérant avoir formé une opposition valide au congé. Dans ce cadre, il invoque un établissement arbitraire des faits.

3.1. En préambule, la procédure était régie par la maxime des débats dès lors que la valeur litigieuse excédait 30’000 fr. dans ce conflit de droit du travail (art. 247 al. 2 let. b ch. 2 CPC a contrario). Les parties devaient donc alléguer les faits sur lesquels elles fondaient leurs prétentions et produire les preuves s’y rapportant (art. 55 al. 1 CPC), le juge n’ayant qu’un devoir d’interpellation fondé sur l’art. 56 CPC. Le juge ne pouvait asseoir son jugement sur d’autres faits que ceux ayant été allégués par les parties conformément aux règles de procédure (ATF 149 III 304 consid. 4.1). 

3.2.1. En vertu de l’art. 336b al. 1 CO, la partie qui entend demander une indemnité pour résiliation abusive (art. 336 et 336a CO) doit faire opposition au congé par écrit auprès de l’autre partie, au plus tard jusqu’à la fin du délai de congé. Si l’opposition est valable et que les parties ne s’entendent pas pour maintenir le rapport de travail, la partie qui a reçu le congé peut faire valoir sa prétention à une indemnité. Elle doit agir par voie d’action en justice dans les 180 jours à compter de la fin du contrat, sous peine de péremption (al. 2). 

 3.2.2. Selon la jurisprudence, il ne faut pas poser des exigences trop élevées à la formulation de cette opposition écrite. Il suffit que son auteur y manifeste à l’égard de l’employeur qu’il n’est pas d’accord avec le congé qui lui a été notifié (ATF 136 III 96 consid. 2; 123 III 246 consid. 4c; arrêt 4A_59/2023 du 28 mars 2023 consid. 4.1 et les réf. cit.). L’opposition a pour but de permettre à l’employeur de prendre conscience que son employé conteste le licenciement et le considère comme abusif; elle tend à encourager les parties à engager des pourparlers et à examiner si les rapports de travail peuvent être maintenus (cf. art. 336b al. 2 CO). Cela suppose que l’employé ait la volonté de poursuivre les rapports de travail (arrêt 4A_320/2014 du 8 septembre 2014 consid. 3.3). Le droit du travailleur de réclamer l’indemnité pour licenciement abusif s’éteint si le travailleur refuse l’offre formulée par l’employeur de retirer la résiliation (ATF 134 III 67 consid 5). 

3.2.3. Il n’y a pas d’opposition lorsque le travailleur s’en prend seulement à la motivation de la résiliation, ne contestant que les motifs invoqués dans la lettre de congé, et non la fin des rapports de travail en tant que telle (arrêt 4A_59/2023 précité ibidem). Dans l’arrêt précité, le Tribunal fédéral a relevé qu’il résultait des faits souverainement constatés par la cour cantonale que l’employé avait écrit qu’il formait opposition au congé et simultanément qu’il prenait acte que les rapports de travail prendront fin en date du […]. L’employé déclarait tout à la fois qu’il formait opposition au congé et que ce congé interviendrait bel et bien à une date donnée. Ces deux éléments étaient antagonistes puisque soit l’employé accepte la résiliation soit il s’y oppose. Dans un tel cas de figure, il convenait donc de procéder par interprétation, selon les règles communément admises. La cour cantonale, par le biais de l’interprétation subjective, avait établi en fait que l’employé n’avait pas l’intention de poursuivre la relation de travail, point non contesté devant le Tribunal fédéral, et qui excluait toute indemnisation. 

Cet arrêt a suscité diverses réactions doctrinales négatives, d’aucuns considérant qu’il ne suffisait plus pour la personne employée de former opposition au congé (…). L’arrêt n’a pourtant pas l’étendue que la doctrine veut lui prêter. L’arrêt cite différents arrêts rendus antérieurement dont il n’entend pas s’écarter. Surtout, la solution de l’arrêt repose sur la détermination par l’instance cantonale de la véritable intention de l’employé par l’interprétation subjective. Il ne s’agit nullement d’une interprétation selon le principe de la confiance. L’intention de l’employé était d’accepter la fin des rapports de travail. Or l’interprétation subjective relève de l’établissement des faits, que le Tribunal fédéral ne revoit que sous l’angle de l’arbitraire. Cet aspect n’avait pas été valablement contesté. La cause s’est donc jouée sur l’intention établie et non contestée de l’employé de ne pas poursuivre la relation de travail, ce qui excluait toute indemnisation. Le Tribunal fédéral étant lié par l’interprétation subjective, il n’a pas eu à porter son examen sur l’interprétation objective.

3.3.1. Avec l’opposition au congé signifié, l’employé manifeste sa volonté de poursuivre les rapports de travail, cette manifestation de volonté pouvant être sujette à interprétation sur la base de l’art. 18 CO, dès lors que dans certaines hypothèses l’opposition formelle du travailleur peut présenter un caractère contradictoire avec sa volonté d’une poursuite des rapports de travail (WYLER/HEINZER/WITZIG, Droit du travail, 5e éd. 2024, p. 912). L’opposition écrite au congé selon l’art. 336b CO est une manifestation de volonté unilatérale par laquelle l’employé déclare vouloir poursuivre les rapports de travail. Il convient tout d’abord de rechercher quelle était la volonté réelle du déclarant (interprétation subjective). Si une telle volonté ne peut être établie, le juge déterminera alors quel sens il convenait de donner à la déclaration selon le principe de la confiance (interprétation objective). L’interprétation subjective peut être déterminée empiriquement sur la base d’indices, en particulier le contexte général, soit toutes les circonstances permettant de découvrir la volonté réelle, qu’il s’agisse de déclarations antérieures ou de faits postérieurs (ATF 144 III 93 consid. 5.2.2). L’appréciation de ces indices concrets par le juge et l’interprétation subjective relèvent de l’établissement des faits. Le Tribunal fédéral est lié (art 105 al. 1 LTF) à moins qu’elles ne soient manifestement inexactes (art. 97 al. 1 et art. 105 al. 2 LTF), c’est-à-dire arbitraires au sens de l’art. 9 Cst. ( supra consid. 2.2; ATF 144 III 93 consid. 5.2.2). 

3.3.2. Un auteur observe la difficulté de procéder à une interprétation subjective s’agissant de l’interprétation d’une manifestation de volonté – acte formateur unilatéral tel qu’une opposition à un congé, ajoutant qu’une interprétation objective selon le principe de la confiance serait plus appropriée (…). Certes, conformément à la jurisprudence, l’opposition suffit en général à concrétiser la volonté de l’employé de maintenir les rapports de travail ( …). Il n’en reste pas moins que les règles communes d’interprétation s’appliquent et que dans certains cas, une interprétation subjective peut aboutir. Ce n’est que si une telle interprétation n’aboutit pas que le juge doit alors procéder à une interprétation objective. 

3.4. En l’espèce, par courrier du 26 août 2019, l’intimée a résilié les rapports de travail pour le 28 février 2020. Le 29 août 2019, le recourant a adressé une note interne à son supérieur C.________ où il écrivait, après avoir fait des remarques acerbes à ce dernier, dans une police plus grande que le reste du texte « Vivement le 28 février 2020 », soit la date de l’échéance des rapports de travail selon la lettre de résiliation de l’intimée. Le 24 octobre 2019, le recourant, par l’entremise de son avocat, a indiqué qu’il « forme opposition à son congé et ceci au sens de l’art. 336b CO ». Le recourant s’est vu reconnaître un état d’incapacité de travail du 3 septembre 2019 au 29 novembre 2019. Le dernier jour de son incapacité de travail était cependant postérieur de dix jours à la date où il a conclu un contrat de travail avec un tiers, le 18 novembre 2019, avec une entrée en fonction le dimanche 1er décembre 2019. Selon la cour cantonale, ce faisant, il a clairement manifesté à un tiers vouloir travailler pour celui-ci d’une part et qu’il ne voulait plus travailler pour l’intimée d’autre part. En arrêt de travail au moment de l’opposition, il ne pouvait être retenu une volonté interne de sa part de vouloir continuer les rapports de travail avec l’intimée dès lors qu’il avait signé un mois après son opposition au congé un contrat de travail avec un tiers. La cour cantonale a retenu en conséquence que le recourant n’avait pas la volonté de continuer à travailler pour l’intimée. Cela était de surcroît déjà clairement établi par la note interne que le recourant avait adressée le 29 août 2019. La cour cantonale a en outre exposé que financièrement, vu les avances effectuées, l’intimée n’était pas en demeure s’agissant de la rémunération du recourant au moment de l’opposition. Il n’avait déjà pas l’intention de continuer à travailler pour l’intimée à ce moment et a par ailleurs signé un contrat dès le 18 novembre 2019 avec un tiers, alors que le salaire de novembre 2019 n’était pas encore dû. 

3.5. Le recourant se plaint d’une appréciation arbitraire des preuves relativement à la négation par la cour cantonale de sa réelle intention de poursuivre les rapports de travail. Il conteste la portée accordée à sa note du 29 août 2019. Ce faisant il se limite à une critique appellatoire, mettant en avant les tensions existant avec son supérieur C.________. Il n’établit nullement qu’il était arbitraire de prendre en compte cet indice, à savoir qu’avant même d’avoir formulé son opposition, il n’entendait pas poursuivre la relation de travail pour se réjouir de l’échéance du contrat le 28 février 2020. Le recourant met aussi en exergue que son courrier d’opposition soulignait le caractère abusif du licenciement, aspect non repris dans l’arrêt attaqué. De la sorte, il n’invoque rien de déterminant quant à son intention de poursuivre les rapports de travail. Le recourant remet encore en cause la prise en compte du nouveau contrat de travail qu’il a signé comme obstacle à sa volonté réelle de poursuivre le travail avec l’intimée. Il observe en substance qu’il a signé un nouveau contrat dès lors que l’intimée ne lui versait plus son salaire, ce qui a justifié de son côté la résiliation avec effet immédiat des rapports de travail le liant à l’intimée le 29 novembre 2019. Il mentionne encore un courrier de l’intimée du 1er novembre 2019 qui attesterait selon lui qu’elle n’avait aucune intention de poursuivre les relations de travail. La cour cantonale a exposé que financièrement, vu les avances effectuées, l’intimée n’était pas en demeure s’agissant de la rémunération du recourant au moment de l’opposition et qu’au moment de signer le nouveau contrat, le salaire de novembre 2019 n’était pas encore dû par l’intimée. Celui-ci n’avait déjà pas l’intention de continuer à travailler pour l’intimée au moment de l’opposition et a par ailleurs signé un contrat dès le 18 novembre 2019 avec un tiers, alors que le salaire de novembre 2019 n’était pas encore dû ( supra, consid. 3.4). Globalement, l’ensemble des éléments invoqués par le recourant revient à rediscuter librement l’appréciation de la cour cantonale. Cette démarche appellatoire n’est pas admissible devant le Tribunal fédéral. La prise en compte de la note interne du recourant du 29 août 2019, formulée avant son opposition, et de la signature par celui-ci d’un nouveau contrat de travail avec un tiers pour conclure à l’absence de volonté réelle du recourant de poursuivre la relation de travail avec l’intimée n’a rien d’arbitraire. 

3.6. Il résulte de ce qui précède qu’à l’issue de son interprétation subjective la cour cantonale pouvait nier l’intention du recourant de poursuivre les rapports de travail. Cela conduit à nier la validité de l’opposition et, par conséquent, à exclure toute indemnisation pour licenciement abusif. La solution cantonale ne viole pas le droit fédéral. Vu ce qui précède, les critiques du recourant relatives à l’interprétation selon le principe de la confiance sont sans portée. 

(TF 4A_618/2024 du 7 juillet 2025 ; on lira, sur les exigences – byzantines – relatives à l’opposition selon la jurisprudence du TF W. GLOOR, L’opposition au congé: des conditions supplémentaires à sa validité, commentaire de l’arrêt du Tribunal fédéral 4A_59/2023, Newsletter DroitDuTravail.ch juin 2023 ; par ailleurs, et en passant, on relèvera que le travailleur licencié abusivement ne pourrait prétendre à rien s’il devait recouvrer du travail rapidement faute de vouloir maintenir des rapports des rapports de travail que l’employeur aura tout fait pour rompre…)

Me Philippe Ehrenström, avocat, LLM

Publié dans Licenciement abusif | Tagué , , , , , , | Laisser un commentaire

Le mandataire professionnellement qualifié en procédure prud’homale (épisode no 4583)

Le 1er septembre 2016, C.________ SA (aujourd’hui B.________ SA; ci-après: l’employeuse, la défenderesse ou l’intimée) a engagé A.________ (ci-après: le travailleur, le demandeur ou le recourant) en qualité de monteur pour un salaire horaire brut de 29 fr. 94, vacances, jours fériés et 13e salaire compris.

L’employeuse a résilié le contrat de travail le 21 juin 2017 pour le 31 juillet 2017.

Après une tentative de conciliation infructueuse, le travailleur a saisi, le 16 juillet 2018, le Tribunal des prud’hommes de l’arrondissement de la Sarine d’une demande en paiement à l’encontre de l’employeuse. Le demandeur y concluait au versement d’un montant total de 4’592 fr. 33, sous déduction des charges sociales, correspondant à des heures de déplacement et des frais de repas non payés. 

Dans cette procédure, le demandeur agissait par l’intermédiaire d’un syndicat et était représenté par une secrétaire syndicale non-juriste, tandis que l’intimée était représentée par un avocat.

Par décision du 9 juillet 2020, la juridiction de première instance a rejeté la demande en paiement. Elle a estimé que le demandeur n’avait pas suffisamment allégué les faits pertinents en lien avec ses prétentions, ni ne les avaient prouvés, respectivement n’avait pas offert de moyens de preuve adéquats (complètement d’office selon l’art. 105 al. 2 LTF). Cette conclusion procédait de la considération selon laquelle la représentante du demandeur devait être assimilée à une avocate, de sorte que la maxime inquisitoire sociale se trouvait atténuée.

 [Après diverses péripéties procédurales le] Tribunal des prud’hommes de l’arrondissement de la Sarine a rejeté […]  une nouvelle fois la demande en paiement, par décision du 20 avril 2023, pour les mêmes motifs que précédemment […].  Sur recours, la IIe Cour civile du Tribunal cantonal du canton de Fribourg a confirmé la décision du 20 avril 2023, dans un arrêt du 25 juin 2024. 

Contre cet arrêt, qui lui a été notifié le 17 juillet 2024, le demandeur a formé, le 13 septembre 2024, un recours en matière civile et un recours constitutionnel subsidiaire. [….]

 1.1.1. Dans les affaires de droit du travail (art. 72 al. 1 LTF) de nature pécuniaire, le recours en matière civile n’est ouvert en principe que si la valeur litigieuse atteint au moins 15’000 fr. (art. 74 al. 1 let. a LTF), de sorte que le présent recours est irrecevable ratione valoris. Le recourant prétend toutefois que la cause soulève une question juridique de principe, qui permet de déroger à l’exigence de la valeur litigieuse minimale (art. 74 al. 2 let. a LTF).  […]

1.1.3. Le recourant soutient que la question, soulevée par la présente contestation, de savoir si le tribunal doit ou non faire preuve de retenue dans l’application de la maxime inquisitoire sociale (art. 247 al. 2 CPC) lorsqu’une partie est représentée par un mandataire professionnellement qualifié (art. 68 al. 2 let. d CPC) constitue une question juridique de principe.  [Le Tribunal fédéral considère qu’il s’agit d’une question juridique de principe] […]

3.  Le recourant reproche en premier lieu à la cour cantonale d’avoir violé l’art. 247 al. 2 CPC, qui institue la maxime inquisitoire dite simple ou sociale.

3.1. Selon la jurisprudence établie, la maxime inquisitoire sociale implique que les parties doivent recueillir elles-mêmes les éléments du procès. Le tribunal ne leur vient en aide que par des questions adéquates afin que les allégations nécessaires et les moyens de preuve correspondants soient précisément énumérés, mais il ne se livre à aucune investigation de sa propre initiative. Lorsqu’une partie est représentée par un avocat, le tribunal peut et doit faire preuve de retenue, comme dans un procès soumis à la procédure ordinaire (…). 

3.2. Se fondant sur l’arrêt 4A_145/2021 précité ainsi que sur une décision cantonale fribourgeoise invoquant cette jurisprudence fédérale dans une problématique de conversion d’un recours en appel, les juges de deuxième instance ont considéré que les exigences applicables à un mandataire professionnellement qualifié, en particulier un syndicat, étaient identiques à celles applicables à un avocat. Par conséquent, le demandeur ne pouvait, selon la cour cantonale, se prévaloir du droit à être amené à compléter ses allégations insuffisantes et à désigner des moyens de preuve. 

3.3. Le recourant conteste que la maxime inquisitoire sociale ait pu être atténuée dans le cas d’espèce et fait grief aux juges cantonaux de ne pas avoir procédé à une interprétation de l’art. 247 al. 2 CPC selon les méthodes usuelles.  […]

3.4.2. L’art. 247 CPC concerne, selon son intitulé, l' »[é]tablissement des faits » dans le cadre de la procédure simplifiée. Cette disposition prescrit tout d’abord que le tribunal amène les parties, par des questions appropriées, à compléter les allégations insuffisantes et à désigner les moyens de preuve (al. 1). Elle prévoit ensuite (al. 2) que le tribunal établit les faits d’office, d’une part, dans les affaires visées à l’art. 243 al. 2 CPC (let. a; soit les litiges auxquels la procédure simplifiée s’applique ratione materiae, quelle que soit la valeur litigieuse) et, d’autre part, dans les autres litiges portant sur des baux à loyer et à ferme d’habitations et de locaux commerciaux, sur des baux à ferme agricoles ou sur un contrat de travail, lorsque la valeur litigieuse ne dépasse pas 30’000 fr. (let. b). 

Aux termes de l’art. 68 al. 2 CPC, sont autorisés à représenter les parties à titre professionnel, entre autres personnes, les avocats, dans toutes les procédures (let. a), ainsi que les mandataires professionnellement qualifiés, devant les juridictions spéciales en matière de contrat de bail et de contrat de travail, si le droit cantonal le prévoit (let. d). Le canton de Fribourg a fait usage de la réserve habilitante de l’art. 68 al. 2 let. d CPC (cf. art. 129 de la loi du canton de Fribourg du 31 mai 2010 sur la justice [LJ; RSF 130.1]).

Sur le vu de ce qui précède, il y a lieu de retenir que ni le texte ni la systématique de la loi n’expriment l’éventualité d’une atténuation de la maxime énoncée à l’art. 247 al. 2 CPC lorsqu’une ou plusieurs parties sont représentées par un représentant professionnel, en général, ou un mandataire professionnellement qualifié, en particulier. Cette méthode d’interprétation ne restitue cependant pas la volonté du législateur sur ce point, telle qu’elle découle de l’histoire de la disposition litigieuse (…). 

Tout au plus, la lettre et l’économie de l’art. 68 al. 2 CPC permettent-elles de circonscrire la notion de mandataires professionnellement qualifiés ( » beruflich qualifizierte Vertreterinnen und Vertreter « ;  » rappresentanti professionalmente qualificati « ) à des personnes qui tirent leur légitimité à représenter des parties en justice de leur expérience professionnelle, soit d’une certaine spécialisation dans les domaines du droit du travail ou du droit du bail (…). 

3.4.3. Avant l’introduction du Code de procédure civile fédéral, le Code des obligations imposait, pour les litiges portant sur les baux d’habitations et de locaux commerciaux, respectivement pour certains litiges résultant du contrat de travail, une procédure simple et rapide, dans le cadre de laquelle le juge devait établir les faits d’office (ancien art. 274d al. 1 et 3 CO, resp. ancien art. 343 al. 2 et 4 CO). 

Il ressort des travaux préparatoires à l’adoption de l’ancien art. 343 CO – règle de procédure spéciale précurseure de l’ancien art. 274d CO -, que le Conseil fédéral avait d’abord envisagé de prescrire l’exclusion des mandataires professionnels de la procédure simple et rapide. Il avait finalement laissé aux cantons le soin de régler cette question, en précisant notamment qu’il leur était loisible d’autoriser des employés des groupements professionnels à représenter leurs membres. Le Conseil fédéral relevait toutefois qu’en particulier les règles exigeant une procédure simple impliquaient que la représentation des parties par des mandataires professionnels n’occupe qu’une place restreinte (…). 

Dans la décennie suivant l’entrée en vigueur de l’ancien art. 343 CO, le Tribunal fédéral a observé que le devoir du juge de rechercher d’office les preuves constituait la contrepartie de l’exclusion des mandataires professionnels des procédures en matière de conflits du travail, qui prévalait alors dans la plupart des cantons (…). Puis, au début des années 2000, la Cour de céans a formulé la jurisprudence, selon laquelle l’étendue de l’assistance accordée par le tribunal en vertu de la maxime inquisitoire sociale est subordonnée à la question de savoir si la partie considérée procède seule ou si elle est représentée par un avocat (…).

Au moment d’élaborer le CPC, le législateur fédéral a conçu la procédure simplifiée comme une procédure accessible à tout un chacun, destinée à succéder à la procédure simple et rapide (…). Suivant la jurisprudence rendue sous l’empire des anciens art. 274det 343 CO, le Conseil fédéral relevait, s’agissant de la disposition qui deviendrait l’actuel art. 247 CPC: « L’étendue du concours prêté par les autorités judiciaires dans un cas d’espèce dépend […] du statut social et du niveau de formation d’une partie, ainsi que de sa représentation éventuelle par un avocat. [O]n n'[…] a recours [à la ‘maxime inquisitoire sociale’] que dans la mesure où elle est vraiment nécessaire: surtout pour compenser un rapport de forces inégal entre les parties (p. ex. employeur contre travailleur) ou en cas de disproportion des moyens de procéder (partie inexpérimentée face à une partie représentée par un avocat). Lorsque deux parties représentées par un avocat se trouvent face à face, le tribunal peut et doit faire preuve de retenue comme dans un procès ordinaire. » (…). Le projet du Conseil fédéral ne prévoyait par ailleurs pas que des mandataires professionnellement qualifiés puissent intervenir à la représentation professionnelle des parties (…).

Lors des débats parlementaires, la Commission des affaires juridiques du Conseil national a proposé l’adjonction de la let. d à la disposition qui est désormais l’art. 68 CPC, en faisant valoir que « dans la logique de la possibilité pour les cantons d’avoir des tribunaux paritaires et d’avoir des juges qui sont issus des partenaires sociaux, il s’agit de conserver également la faculté, pour des mandataires professionnellement qualifiés issus des partenaires sociaux, de pouvoir représenter les parties dans ces causes-là, par respect de la nature et de l’identité de ce type de juridiction paritaire » (…). L’examen par les Chambres fédérales de la maxime inquisitoire sociale n’a pas donné lieu à un débat ou à des précisions au sujet des circonstances dans lesquelles le tribunal doit observer de la retenue dans l’application de cette règle de procédure (…).

De ces considérations historiques, il appert que le législateur a vu, dès l’origine, dans la représentation professionnelle des parties une circonstance restreignant la simplification voulue du procès civil social. À cet égard, ni le Conseil fédéral, lors de l’élaboration de l’ancien art. 343 CO, ni l’Assemblée fédérale, lors de l’adoption de l’art. 68 al. 2 let. d CPC et de l’art. 247 CPC, n’ont établi de distinction entre les avocats et les mandataires professionnellement qualifiés. L’on ne peut dès lors exclure, compte tenu de ce que le projet de Code de procédure civile unifié réservait la représentation professionnelle aux avocats, que la volonté affichée dans le Message de limiter la portée de la maxime inquisitoire sociale envers la partie représentée par un avocat s’étende aux situations dans lesquelles le justiciable est représenté par un mandataire professionnellement qualifié.

3.4.4.1. La maxime inquisitoire sociale a pour but de protéger la partie faible au contrat, de garantir l’égalité entre les parties au procès et d’accélérer la procédure, en ce qu’elle doit permettre au justiciable qui ne dispose pas de connaissances dans la conduite d’un procès d’agir seul devant les tribunaux (…). 

Il en résulte a contrario que le concours exigé du tribunal par l’art. 247 al. 2 CPC n’a pas pour vocation de bénéficier à une partie qui est à même d’assurer efficacement la défense de ses intérêts. Cette maxime ne doit autrement dit pas servir à suppléer à des carences qui relèvent de la négligence procédurale (…). 

C’est d’ailleurs parce que le juge peut présupposer qu’un avocat dispose des connaissances nécessaires pour conduire le procès et émettre des allégations et offres de preuve complètes que le tribunal est appelé à faire preuve de retenue dans l’application de la maxime inquisitoire sociale à l’égard d’une partie qui agit par l’entremise d’un tel représentant (…).

Une atténuation de la maxime inquisitoire sociale envers une partie représentée par un mandataire professionnellement qualifié peut donc se justifier, du point de vue téléologique, pour autant que le justiciable se trouve, par cette représentation, en mesure de faire valoir ses droits d’une manière effective. Ce n’est en effet qu’à cette condition que les manquements éventuels de cette partie en matière de procédure quittent le domaine de l’inexpérience, pour rejoindre celui de la négligence.

Il s’agit dès lors d’analyser l’aptitude des mandataires professionnellement qualifiés à dispenser des conseils et un soutien qui, en procédure simplifiée, indépendamment de l’implication renforcée du tribunal dans la formulation des allégations et la désignation des moyens de preuve, sont de nature à permettre à la partie qui les sollicite d’obtenir satisfaction. L’on doit ce faisant tenir compte de ce que la maxime inquisitoire sociale s’inscrit dans un régime procédural au formalisme moindre (cf. art. 244 à 246 CPC), en ce sens que les capacités des mandataires professionnellement qualifiés doivent être appréciées en fonction des simplifications qui président en tous les cas à la conduite de ce type de procédure.

3.4.4.2. D’une manière générale, la limitation statuée à l’art. 68 al. 2 CPC des acteurs habilités à représenter des parties à titre professionnel vise à garantir la qualité de la représentation et ainsi à protéger les justiciables (…). 

Plus particulièrement, l’exception au monopole de l’avocat devant les juridictions spéciales en matière de contrat de bail et de contrat de travail a pour objectif d’offrir aux personnes en litige un accès facilité à une aide compétente, leur permettant de mener rapidement et à moindre coût une procédure, sans mettre en danger leur position juridique (…).

Ainsi, l’admission des mandataires professionnellement qualifiés à la représentation professionnelle constitue, en soi, une reconnaissance de leur aptitude à assister de manière efficace des justiciables inexpérimentés dans la poursuite de leurs intérêts subjectifs juridiquement protégés.

Or, une telle aptitude – qui ne peut qu’être renforcée lorsque les allégements formels de la procédure simplifiée s’appliquent – ressortit à la qualité même de mandataire professionnellement qualifié. S’attache en effet à cette fonction, l’exigence de disposer de solides connaissances théoriques et pratiques du domaine juridique touché et de la procédure applicable (…). Le savoir-faire attendu de cette catégorie de représentants dans leur champ d’activité spécifique est par ailleurs indépendant d’une formation juridique, si bien qu’un juriste généraliste, même titulaire du brevet d’avocat, ne peut prétendre intervenir comme mandataire professionnellement qualifié (…). 

Sous ce rapport, les associations de locataires, de propriétaires immobiliers ou de gérants d’immeubles, ainsi que les syndicats et les associations patronales, en tant qu’ils disposent généralement en leur sein de collaborateurs dotés de l’expérience requise, sont réputés revêtir le statut de mandataires professionnellement qualifiés (—). 

Quoi qu’il en soit, s’il s’avère in concreto que la personne intervenant à la défense des intérêts d’une partie à titre de mandataire professionnellement qualifié n’est pas en mesure de mobiliser les connaissances nécessaires à l’affaire qui lui a été confiée, le tribunal doit lui dénier la capacité de postuler (…). 

3.4.4.3. Les éléments qui précèdent (…) enseignent que les mandataires professionnellement qualifiés sont, de par les conditions posées à la reconnaissance de leur statut, en mesure de faire bénéficier leurs mandants de compétences qui, compte tenu des aménagements de la procédure simplifiée, sont de nature à leur procurer gain de cause. 

Partant, le juge peut raisonnablement attendre d’une partie qui procède par l’entremise d’une personne répondant à la définition de mandataire professionnellement qualifié qu’elle agisse sciemment en procédure simplifiée, ses éventuels manquements devant être appréhendés à cette aune.

Il s’ensuit qu’une atténuation de la maxime inquisitoire sociale à l’égard d’une telle partie est justifiée, sous l’angle téléologique.

3.5. L’interprétation de l’art. 247 al. 2 CPC, en relation avec l’art. 68 al. 2 let. d CPC, permet en conséquence d’établir que, dans les causes soumises à la maxime inquisitoire sociale, le tribunal peut et doit faire preuve de retenue dans son implication dans l’établissement des faits, comme dans un procès soumis à la procédure ordinaire, en cas de représentation par un mandataire professionnellement qualifié. 

3.6.1. La portée ainsi dégagée de la maxime inquisitoire sociale est conforme à la liberté syndicale (art. 28 Cst.), dès lors qu’elle prend acte des capacités existantes des syndicats de défendre convenablement leurs membres ou des tiers, sans leur imposer, directement ou indirectement, de modifier leur action ou leur organisation.  (…)

3.7. Dans le cas d’espèce, il est établi que le recourant, alors qu’il était représenté par une secrétaire syndicale, a initié la présente cause par le dépôt d’une demande présentant des carences factuelles, qu’il n’a pas rectifiées avant les délibérations de la juridiction de première instance, n’ayant pas été interpellé en ce sens par le tribunal. 

Les constatations de la cour cantonale ne permettent pas d’inférer que ces carences relèveraient d’inadvertances évidentes, qui auraient dû, en toute hypothèse, susciter une interpellation de la part du tribunal de première instance. Le recourant ne le soutient d’ailleurs nullement.

Il est pareillement incontesté et n’avait déjà pas été remis en cause devant l’instance précédente que la représentante du demandeur disposait de la qualité de mandataire professionnellement qualifié. Sa capacité de postuler, que l’état de fait cantonal ne fait pas ressortir comme manifestement absente, ne peut dès lors pas être examinée par le Tribunal fédéral.

Aussi, compte tenu de la retenue qui s’imposait en l’occurrence dans la mise en pratique de la maxime inquisitoire sociale, la cour cantonale n’a nullement violé le droit fédéral en considérant que la première instance avait fait une application correcte de l’art. 247 al. 2 CPC.

Partant, ce grief du recourant doit être rejeté.

(TF 4A_482/2024 du 12 août 2025, destiné à la publication)

Me Philippe Ehrenström, avocat, LLM

Publié dans Procédure | Tagué , , , , , , , | Laisser un commentaire

IA : pourquoi les hallucinations ?

Quelques réflexions tirées de A. Tauman Kalai/O.Nachum/S.Vempala/E.Zhang, Why Language Models Hallucinate ? publié par OpenAI (https://cdn.openai.com/pdf/d04913be-3f6f-4d2b-b283-ff432ef4aaa5/why-language-models-hallucinate.pdf; voir aussi le résumé sur le site d’OpenAI : https://openai.com/index/why-language-models-hallucinate/):

L’un des problèmes les plus persistants et les plus débattus dans le développement des modèles de langage de grande taille, tels que ceux utilisés par OpenAI, réside dans les « hallucinations ». Par ce terme, les chercheurs n’entendent pas un phénomène comparable à l’expérience sensorielle humaine, mais plutôt la tendance des modèles à produire des affirmations fausses mais plausibles, souvent avec assurance. Le problème n’est pas anecdotique : il mine la confiance des utilisateurs, fragilise l’adoption des systèmes d’IA et soulève des enjeux juridiques et éthiques considérables dès lors que ces outils interviennent dans des contextes professionnels sensibles, par exemple en santé, en justice ou en information publique.

L’article académique et son résumé expliquent que la cause profonde de ces hallucinations ne tient pas à un défaut mystérieux ou imprévisible, mais découle d’une logique statistique liée à la manière dont les modèles sont entraînés et évalués.

L’analyse commence par rappeler la structure classique du cycle de formation des grands modèles de langage : d’abord une phase de pré-entraînement, où le modèle apprend la structure du langage à partir d’immenses corpus de textes ; ensuite une phase dite de post-entraînement, où il est ajusté par des méthodes d’alignement telles que l’apprentissage par renforcement à partir de feedback humain ou algorithmique. Chacune de ces étapes contribue, pour des raisons différentes, à la production et à la persistance des hallucinations.

Pendant le pré-entraînement, le modèle apprend à prédire la suite la plus probable d’un texte donné. Il est donc immergé dans un océan de phrases valides, souvent bien formées, mais où certaines informations factuelles sont rares, uniques ou aléatoires. Les auteurs prennent l’exemple des dates d’anniversaire ou des titres de thèses universitaires. Ces informations ne suivent aucun schéma prévisible, contrairement à la grammaire ou à l’orthographe. Si, dans le corpus, l’anniversaire d’une personne apparaît une seule fois, le modèle n’a aucun moyen statistique robuste de généraliser cette information.

L’analogie proposée est significative : si l’on tentait d’entraîner un algorithme de reconnaissance d’images non pas à distinguer chiens et chats, mais à deviner la date de naissance de chaque animal à partir de sa photo, l’échec serait inévitable, car il n’existe aucun motif visuel corrélé à cette donnée. De la même manière, un modèle de langage peut apprendre à conjuguer sans erreur, mais il sera condamné à se tromper sur des faits isolés.

L’article formalise cela en rapprochant la génération de texte d’un problème de classification binaire : distinguer entre énoncés valides et énoncés erronés. Toute erreur de classification statistique se traduit, dans un modèle génératif, par une hallucination. Même avec des données parfaites et sans erreur dans le corpus, l’algorithme de prédiction entraînerait mécaniquement un taux incompressible d’erreurs sur les faits rares ou aléatoires.

Ce premier constat est aggravé par le mode d’évaluation dominant dans le domaine. Lorsqu’un modèle est testé, il est noté sur sa capacité à donner la bonne réponse. Or la majorité des benchmarks, qui alimentent les classements internationaux et guident la recherche comme le marché, utilisent une logique binaire : une réponse exacte vaut un point, toute autre réponse vaut zéro. Dans ce système, le silence ou l’aveu d’ignorance est pénalisé de la même manière qu’une erreur. Le modèle a donc intérêt à « deviner », exactement comme un étudiant qui, face à une question de QCM, choisit de cocher une case au hasard plutôt que de laisser vide. Sur le long terme, cette stratégie de devinette maximise le score, même si elle augmente la fréquence des réponses fausses données avec aplomb. Les chercheurs parlent ici d’un « biais de bon élève » : les modèles sont optimisés pour réussir les examens, pas pour être honnêtes quant à leurs incertitudes. De ce fait, les hallucinations ne sont pas corrigées par le post-entraînement, elles sont au contraire renforcées, car le système apprend que l’aveu d’ignorance lui coûte des points.

Les auteurs insistent sur l’idée que les hallucinations ne doivent pas être perçues comme un mystère insondable. Ce sont, en termes statistiques, des erreurs naturelles, comparables aux erreurs de classification bien connues en apprentissage supervisé. De plus, elles surviennent plus fréquemment dans certains cas bien identifiés : lorsqu’il n’existe pas de motif stable dans les données, lorsqu’un modèle est structurellement trop limité pour représenter correctement une règle, ou encore lorsque les données d’entraînement contiennent elles-mêmes des erreurs, ce qu’on désigne par l’acronyme GIGO (« garbage in, garbage out »). Ces facteurs expliquent pourquoi un modèle peut écrire sans faute d’orthographe mais inventer de toutes pièces une référence bibliographique ou un détail biographique.

Le problème ne se limite pas à la nature des erreurs, il touche aussi à leur présentation. Les hallucinations apparaissent généralement sous une forme convaincante, formulées avec certitude. Le modèle préfère annoncer une date précise plutôt qu’admettre une ignorance. Ce caractère trompeur est renforcé par les évaluations dominantes, qui, en privilégiant la justesse brute, valorisent la prise de risque plutôt que la prudence. Ainsi, si deux modèles existent, l’un qui dit « je ne sais pas » lorsqu’il est incertain et l’autre qui devine systématiquement, c’est le second qui obtiendra la meilleure place au classement, alors même qu’il produit davantage d’erreurs manifestes. Cela crée une incitation négative, que les chercheurs qualifient d’« épidémie de pénalisation de l’incertitude ».

Pour sortir de cette impasse, les auteurs proposent une approche socio-technique.

Plutôt que de multiplier des benchmarks spécifiques sur les hallucinations, ce qui reste marginal face aux évaluations dominantes, il faudrait modifier en profondeur la manière dont les tests existants attribuent leurs notes. Concrètement, il s’agirait de s’inspirer de certains concours scolaires ou universitaires qui, pour éviter le hasard, attribuent des points négatifs aux mauvaises réponses ou au contraire des points partiels à l’abstention. Par exemple, on pourrait indiquer explicitement que si le modèle répond à une question avec moins de 75 % de confiance, il sera plus sévèrement pénalisé en cas d’erreur que s’il s’abstient. L’objectif est de donner une valeur mesurable à l’humilité, en encourageant l’IA à signaler ses incertitudes plutôt qu’à masquer ses lacunes. C’est ce que les chercheurs appellent la « calibration comportementale » : un modèle doit être jugé non seulement sur la véracité de ses affirmations, mais aussi sur sa capacité à aligner son comportement avec son niveau de confiance.

Les implications pratiques de ces analyses sont nombreuses pour les professions juridiques. Premièrement, elles montrent que les hallucinations ne sont pas un accident imprévisible mais une conséquence prévisible du design actuel des modèles. Cela invite à la prudence dans leur usage probatoire ou décisionnel : toute réponse produite par une IA doit être considérée comme potentiellement affectée d’un biais structurel de « devinette ». Deuxièmement, elles soulignent que la responsabilité ne pèse pas uniquement sur la technologie mais aussi sur l’écosystème des évaluations, benchmarks et classements qui guident la recherche. Tant que ces instruments de mesure continueront à pénaliser l’expression d’incertitude, les concepteurs seront incités à produire des modèles « bons élèves » mais peu fiables. Troisièmement, elles ouvrent la voie à des solutions normatives ou contractuelles. Il est envisageable d’imposer, par la régulation ou par des standards de marché, des obligations de transparence sur les taux d’abstention et sur la manière dont un modèle exprime ses incertitudes, plutôt que de se contenter d’indicateurs d’exactitude brute. Enfin, elles permettent de corriger certaines idées reçues : non, les hallucinations ne disparaîtront pas mécaniquement avec des modèles plus gros ou des algorithmes de recherche externe, car le problème réside dans la logique même de l’entraînement et de l’évaluation ; non, elles ne sont pas inévitables, car un modèle pourrait toujours s’abstenir de répondre ; et non, elles ne sont pas une bizarrerie inexplicable, mais une conséquence claire de choix méthodologiques.

La conclusion de l’article et de son résumé insiste sur la nécessité de modifier la culture d’évaluation des systèmes d’IA. Si les classements, les publications et les cartes de modèle (« model cards ») continuent à valoriser exclusivement la précision brute, les modèles continueront d’apprendre à deviner. Si au contraire, les instances de normalisation, les organismes de recherche et les acteurs du marché adoptent des systèmes de notation qui récompensent l’expression appropriée de l’incertitude, alors les hallucinations pourront être réduites de manière significative. Les chercheurs reconnaissent que cela suppose non seulement un ajustement technique des métriques, mais aussi une adoption collective dans les pratiques de la communauté scientifique et industrielle, ce qui est un défi social autant que technologique.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans intelligence artificielle | Tagué , , | Un commentaire

Droit à l’obscurité et interdiction de la reconnaissance faciale

Quelques réflexions tirées de W. Hartzog/E. Selinger /J. Hyojoo Rhee, Normalizing Facial Recognition Technology and The End of Obscurity (September 06, 2025). 6 European Review of Digital Administration and Law (ERDAL) 163 (2025) (https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5450895):

Selon ses auteurs, la reconnaissance faciale n’est pas un outil parmi d’autres qu’il conviendrait de réguler avec prudence ou d’encadrer par des garde-fous, mais un instrument d’une dangerosité telle qu’il doit être purement et simplement interdit. Leur raisonnement prend place en trois parties : puissance technique propre de la reconnaissance faciale, mécanismes psychologiques de normalisation qui accompagnent son usage, et choix juridiques qui, loin de contenir le phénomène, contribuent à l’amplifier. C’est en reliant ces trois dimensions que les auteurs construisent leur démonstration et plaident pour une interdiction générale et définitive. Pour bien comprendre leur démarche, il convient de suivre pas à pas leur progression et de mettre en lumière les articulations essentielles de leur raisonnement.

Le point de départ de l’argumentation repose sur un constat technologique : la reconnaissance faciale constitue un outil de surveillance sans équivalent. Là où d’autres techniques de contrôle ont des limites matérielles, logistiques ou contextuelles, la reconnaissance faciale tire sa force d’un double mouvement. D’un côté, elle exploite des caractéristiques physiques universelles et visibles : chacun d’entre nous a un visage qui le singularise, mais qu’il est difficile, voire impossible, de masquer sans éveiller immédiatement des soupçons. Contrairement aux empreintes digitales, que l’on ne prélève qu’à l’occasion d’un contact direct avec un support ou un scanner, le visage est en permanence offert au regard. De l’autre côté, ce visage est déjà disséminé sur une infinité de supports numériques : photographies publiées en ligne, profils de réseaux sociaux, bases de données administratives ou commerciales. Ainsi, la reconnaissance faciale permet de relier en temps réel les corps présents dans l’espace public aux traces numériques accumulées sur Internet. Elle rend possible une identification instantanée, à grande échelle, et à un coût marginal extrêmement faible. Cette combinaison – universalité du signe physiologique et abondance des données disponibles – confère à la reconnaissance faciale une puissance de surveillance inédite.

Cette puissance technique ne s’arrête pas à l’identification. Les auteurs soulignent que la reconnaissance faciale s’intègre facilement à des infrastructures déjà existantes, comme les réseaux de caméras de surveillance. Elle peut en outre être augmentée par des modules complémentaires, notamment la détection d’émotions ou la caractérisation des comportements. Ces modules, qui prétendent inférer des états psychologiques à partir de l’expression du visage, s’apparentent à une nouvelle forme de physiognomonie numérique, souvent assimilée à de la pseudo-science. Leur diffusion accentue les risques de biais et de discriminations, puisqu’ils tendent à classer et à hiérarchiser les individus selon des critères contestables. L’ensemble produit un effet cumulatif : la reconnaissance faciale n’est pas seulement un outil parmi d’autres, elle est conçue pour devenir le cœur d’un écosystème de surveillance globale, capable de repérer, de suivre et de qualifier les personnes dans la plupart des espaces de leur vie quotidienne.

La comparaison avec d’autres technologies éclaire encore cette singularité. Les lecteurs automatiques de plaques d’immatriculation, par exemple, ne concernent que les conducteurs et n’opèrent que dans certains lieux. La surveillance des réseaux sociaux dépend de l’inscription volontaire et peut être contournée par le silence numérique. Le visage, lui, nous accompagne partout et constitue le signe par lequel nous sommes spontanément identifiés dans nos interactions sociales. C’est bien ce caractère incontournable et omniprésent qui rend la reconnaissance faciale plus intrusive que n’importe quel autre système de contrôle.

Une fois établi ce diagnostic technique, les auteurs introduisent une dimension sociopsychologique : le mécanisme de normalisation. Même si la reconnaissance faciale suscite d’abord des réactions de méfiance, ses usages répétés, surtout lorsqu’ils sont présentés comme pratiques ou anodins, finissent par rendre la technologie banale. Déverrouiller un smartphone par reconnaissance faciale ou franchir rapidement un contrôle d’embarquement à l’aéroport ne provoque pas d’indignation collective. Au contraire, ces gestes paraissent relever du confort, voire du progrès. Chaque usage de ce type contribue pourtant à installer dans les esprits l’idée que le scan du visage est normal, quotidien, acceptable. Deux processus distincts expliquent cette banalisation. Le premier est celui de l’habitue : à force de voir ou d’utiliser un dispositif, nous cessons d’y prêter attention. Ce qui était exceptionnel devient routinier. Le second est celui de la normalisation favorable : constatant que les autres utilisent sans difficulté un outil, nous en déduisons qu’il est légitime et nous sommes enclins à l’adopter à notre tour. Ces dynamiques psychologiques déplacent progressivement la frontière de ce qui est jugé tolérable.

L’enjeu, ici, est celui de l’« obscurité », concept que les auteurs privilégient par rapport à la seule notion de vie privée. L’obscurité désigne l’écran protecteur que constituent les coûts d’accès à l’information. Dans un monde analogique, il était toujours possible, en théorie, de recueillir des renseignements sur autrui, mais l’effort à fournir – en temps, en ressources, en déplacements – rendait l’opération difficile et décourageait la plupart des curieux. Cette obscurité, faite d’obstacles pratiques, protégeait la vie sociale ordinaire et permettait une certaine autonomie. La reconnaissance faciale, en réduisant presque à zéro ces coûts de transaction, détruit ce régime d’obscurité. Les conversations publiques, les déplacements quotidiens, les simples interactions sociales cessent d’être protégés par cette barrière implicite. La possibilité constante d’une identification et d’un suivi transforme l’espace public en un lieu d’exposition permanente, produisant un effet dissuasif sur la liberté d’expression et de comportement.

Le troisième volet du raisonnement met en cause le rôle du droit. Loin de constituer un contre-poids efficace, les cadres juridiques actuels favorisent la normalisation de la reconnaissance faciale. Plusieurs mécanismes sont ici identifiés. Le premier tient à l’exigence de dommage significatif. Pour qu’une atteinte à la vie privée soit sanctionnée, il faut généralement démontrer une conséquence grave et immédiate. Les petites intrusions répétées, les micro-surveillances qui forment le quotidien numérique, échappent ainsi à la vigilance juridique. Or ce sont précisément ces « entailles » multiples, qualifiées de « privacy nicks », qui produisent à long terme la véritable érosion de l’obscurité. Le deuxième mécanisme réside dans l’importance donnée au consentement et à l’exposition volontaire. La logique est simple : ce qui est volontairement montré, ou accepté, ne peut plus être protégé. Mais appliquée au visage, cette logique devient absurde : nous ne pouvons pas dissimuler nos traits sans altérer nos interactions sociales. Le droit assimile pourtant la simple visibilité à une renonciation à la protection, ouvrant ainsi la voie à l’usage illimité des images disponibles. Le troisième mécanisme est lié à la focalisation sur les effets de proximité. Les juridictions cherchent un lien direct entre une action et un préjudice précis. Elles peinent à appréhender les effets cumulatifs et diffus d’un ensemble d’actes isolés. Ce morcellement empêche de traiter la surveillance comme un phénomène systémique et de mesurer ses conséquences globales sur la société. Enfin, le quatrième mécanisme tient à la dépendance aux attentes sociales. Le droit américain, notamment, évalue la protection de la vie privée à l’aune des « attentes raisonnables » des individus. Or ces attentes sont elles-mêmes façonnées par l’habitude et la banalisation. Plus la surveillance devient commune, plus elle est jugée acceptable, dans un cercle vicieux qui réduit sans cesse le champ de la protection juridique.

L’analyse se tourne alors vers l’Europe. L’Union européenne, avec son AI Act, a adopté des interdictions ciblées, par exemple pour l’usage de la reconnaissance faciale en temps réel dans l’espace public. Mais ces interdictions sont assorties d’exceptions, notamment pour la recherche de personnes disparues ou la prévention de menaces graves. Ces exceptions, en apparence limitées, ouvrent des brèches qui risquent de banaliser l’usage de la technologie et de créer les conditions de sa généralisation. La dynamique observée aux États-Unis pourrait ainsi se reproduire en Europe, malgré une tradition plus protectrice en matière de droits fondamentaux.

Face à ce constat, quelles réponses envisager ? Les auteurs examinent plusieurs options, mais les écartent les unes après les autres. L’approche technologique neutre, consistant à encadrer les usages plutôt que les outils, paraît séduisante en théorie mais se révèle inefficace en pratique, car elle suppose que la reconnaissance faciale puisse produire plus de bénéfices que de risques, ce qui est démenti par son potentiel d’abus quasi illimité. Les garde-fous procéduraux, tels que l’obligation d’un mandat judiciaire ou le recueil du consentement, ne font qu’institutionnaliser la pratique et la rendre encore plus acceptable aux yeux du public. Les interdictions partielles, même lorsqu’elles visent à protéger certains espaces ou certaines catégories de personnes, demeurent fragiles et exposées à des pressions politiques ou économiques.

La conclusion s’impose alors : seule une interdiction totale permettrait de préserver l’obscurité et de protéger la démocratie. La reconnaissance faciale doit être stigmatisée comme une technologie intrinsèquement dangereuse, dont les risques surpassent les éventuels avantages. Les auteurs n’ignorent pas l’objection d’irréalisme qui leur est adressée. Ils répondent en rappelant que d’autres pratiques, comme la torture, ne sont pas interdites parce qu’elles sont toujours inefficaces, mais parce qu’elles sont incompatibles avec les valeurs fondamentales d’une société démocratique. De même, certains produits ou technologies ont été interdits du fait de leur nocivité, sans que l’on cherche à équilibrer bénéfices et inconvénients. L’interdiction de la reconnaissance faciale doit être pensée dans cette logique : non comme un refus du progrès, mais comme un choix de société destiné à protéger les conditions mêmes de la liberté.

Ce plaidoyer pour la prohibition se veut aussi un avertissement intergénérationnel. La banalisation de la reconnaissance faciale ne se fait pas en un jour, mais elle produit des effets cumulatifs irréversibles. Les générations futures risquent de se retrouver dans un monde où l’obscurité a disparu, où chaque geste est traçable, chaque rencontre enregistrée, chaque émotion analysée. Dans un tel monde, l’autonomie individuelle et la liberté collective seraient durablement compromises. Refuser la reconnaissance faciale aujourd’hui, c’est donc préserver un espace d’obscurité indispensable à la vie démocratique de demain.

L’analyse, si elle peut sembler extrême dans le paysage actuel des débats, a le mérite de mettre en lumière la spécificité de la reconnaissance faciale et de rappeler que certaines technologies, par leur nature même, ne peuvent être domestiquées par de simples régulations. Elle invite juristes, législateurs et citoyens à reconsidérer la logique habituelle du compromis et à envisager que, face à certaines menaces, la seule réponse proportionnée soit l’exclusion.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans intelligence artificielle, Protection de la personnalité, Protection des données | Tagué , , , | Laisser un commentaire

Décision individuelle automatisée et logique sous-jacente (BVwG no W108 2230691-1/53e)

Quelques éléments tirés d’un arrêt du Bundesverwaltungsgericht (BVwG, Cour administrative fédérale autrichienne) du 28 mai 2025, n° W108 2230691-1/53e (https://www.ris.bka.gv.at/Dokumente/Bvwg/BVWGT_20250528_W108_2230691_1_00/BVWGT_20250528_W108_2230691_1_00.pdf) rendu après l’arrêt CJUE C-203/22, Dun & Bradstreet Austria du 27 février 2025) :

L’affaire oppose un particulier à une société d’information commerciale (credit scoring), absorbée en cours de procédure par une autre entité du même secteur. La décision statue sur une plainte en matière de protection des données, avec pour cœur du litige l’étendue du droit d’accès de l’article 15 § 1 let. h  RGPD et, en particulier, l’obligation de fournir des « informations utiles sur la logique sous-jacente » à la décision individuelle automatisée au sens de l’art. 22.

La BVwG admet partiellement la plainte, constate une violation du droit d’accès pour défaut d’information tant sur les finalités (art. 15, §1, let. a) que sur la logique et les effets du scoring (art. 15, §1, let. h), enjoint la société de compléter l’accès dans un délai de quatre semaines et rejette le surplus.

Le point de départ réside dans une demande d’accès du 26 octobre 2018, par laquelle le plaignant sollicite, sur le fondement de l’article 15 RGPD, la communication des données personnelles le concernant. La société répond le 5 novembre 2018 par une note de trois pages listant nom, adresses, sexe, date de naissance, nationalité, éléments professionnels et de revenus estimés, modalités de paiement et des mentions relatives à des consultations passées par des clients, avec, en fin de document, des informations générales sur les finalités, catégories de données, destinataires, durée de conservation, droits de la personne concernée et sources.

La réponse affirme par ailleurs qu’il n’existerait pas, chez la société, de décision automatisée au sens des articles 15, §1, let. h et 22 RGPD. Estimant la réponse incomplète et trop générique, le plaignant saisit l’autorité autrichienne de protection des données (Datenschutzbehörde) le 19 décembre 2018.

L’instruction administrative s’éternise. Le 13 janvier 2020, le plaignant forme un recours pour déni de statuer (Säumnisbeschwerde) contre l’autorité de contrôle. Celle-ci admet que le délai légal est dépassé et transmet le dossier au BVwG, de sorte que la compétence juridictionnelle de celui-ci se trouve activée. La cour reprend alors l’instruction, sollicite des prises de position et attire l’attention des parties sur le caractère insatisfaisant, à ses yeux, des informations initialement délivrées. S’ajoute, au fil de la procédure, un changement structurel : l’entité visée par la plainte est absorbée par une autre société d’information commerciale, de sorte que la défenderesse devient, après fusion, la société absorbante. Celle-ci maintient que la communication de 2018 était complète et qu’aucune décision automatisée n’est prise chez elle, la fourniture de scores n’étant selon elle ni un « profiling » au sens de l’article 22 RGPD ni une base unique de décision chez ses clients.

En 2022, à la demande du BVwG, la société précise que, si des scores ont pu être transmis à des partenaires en 2016 et 2018, ces valeurs n’auraient pas été conservées dans son système, bien que les enregistrements d’accès et les résultats de requête soient journalisés pendant sept ans. Elle reconnaît qu’un « rating » de 2,02 et un « Ampelscore » de 2 avaient été communiqués, traduisant une solvabilité « très bonne ». Elle soutient qu’elle n’intervient jamais dans la décision commerciale de ses clients ni dans la fixation de seuils, et qu’elle ne fait que répondre à des interrogations, notamment dans le contexte du commerce électronique, où l’objectif n’est pas l’octroi d’un crédit mais la détermination d’une modalité de paiement appropriée.

À la fin de 2023, la société réaffirme que la fourniture d’un score à un marchand en ligne, destinée à vérifier l’exactitude de l’adresse ou à calibrer une « steering » des moyens de paiement, ne constituerait pas une « décision » au sens de l’article 22 RGPD ni ne produirait des effets « significatifs » sur la personne concernée. Selon elle, au pire, une personne pourrait être amenée à prépayer sa commande ou à se voir refuser une facilité de paiement, ce qui ne correspondrait pas à l’impact d’un refus de crédit. En outre, elle décrit de façon générale les catégories d’informations entrant dans le calcul, mentionnant, entre autres, le contexte de solvabilité, l’environnement relationnel et des données sociodémographiques, avec une pondération plus importante attribuée à des facteurs comme le revenu, la modalité de paiement ou la branche d’activité ; une description plus fine de la logique serait, selon elle, couverte par le secret d’affaires.

Entre-temps, la cour suspend la procédure dans l’attente d’un arrêt préjudiciel sur l’article 15, §1, let. h RGPD. Par ordonnance du 1er juillet 2024, elle sursoit à statuer jusqu’à l’arrêt de la Cour de justice de l’Union européenne (CJUE) dans l’affaire C-203/22. Cet arrêt est rendu le 27 février 2025.  [Il s’agir de CJUE C-203/22, Dun & Bradstreet Austria du 27 février 2025 : https://eur-lex.europa.eu/legal-content/FR/TXT/?uri=CELEX:62022CJ0203). La CJUE y affirme que la personne concernée peut exiger, en cas de décision automatisée (y compris le profilage au sens de l’art. 22, §1), une explication précise, transparente, compréhensible et aisément accessible des procédures et des principes effectivement appliqués lors du traitement automatisé ayant conduit au résultat, par exemple un profil de solvabilité. La Cour précise aussi que, si des données de tiers protégées par le RGPD ou des secrets d’affaires au sens de la directive 2016/943 sont en jeu, le responsable doit transmettre ces éléments à l’autorité ou au juge compétent, afin qu’une mise en balance des droits et intérêts opposés soit opérée pour délimiter l’étendue de l’accès.

Dans ses motifs, la CJUE insiste sur plusieurs points qui irriguent ensuite le raisonnement du BVwG. D’abord, l’exigence de clarté et de pédagogie issue de l’article 12 RGPD : l’information doit être fournie en termes précis, transparents, compréhensibles et accessibles, dans un langage simple. Ensuite, la finalité de l’article 15 : permettre à la personne concernée de vérifier l’exactitude de ses données et la licéité du traitement, conditionnant l’exercice effectif de ses autres droits, dont la contestation d’une décision automatisée et la présentation de son point de vue au sens de l’article 22, §3. S’agissant du contenu de l’information à délivrer au titre de l’article 15, §1, let. h, la Cour écarte à la fois la simple transmission d’une formule mathématique complexe et la description pas à pas de chaque étape algorithmique ; elle exige au contraire une explication opérationnelle des procédures et principes appliqués, permettant à la personne de comprendre quelles données personnelles ont été utilisées et comment, et, le cas échéant, dans quelle mesure une variation de ces données aurait conduit à un autre résultat. Enfin, la Cour précise la méthode de protection des secrets d’affaires : leur existence ne justifie pas un refus global de l’accès, mais un mécanisme de « boîte noire » où l’autorité de contrôle ou le juge reçoit les éléments sensibles et pèse les intérêts pour définir ce qui peut être communiqué à la personne concernée.

À la reprise de la procédure, la BVwG invite la société à produire l’ensemble des informations et données encore disponibles, avec une explication intelligible de la logique du traitement automatisé et du résultat dans le cas du plaignant, ainsi que toute information permettant de vérifier l’exactitude et la licéité de la décision automatisée, y compris les critères appliqués, leur pondération, la manière dont les catégories de données ont été utilisées et une explication du rattachement du plaignant au score qui lui a été attribué, le tout avec indication spécifique des éléments éventuellement protégés par le secret d’affaires. La cour souligne que cette demande répond directement aux critères posés par la CJUE et fixe un délai bref, jugeant celui-ci adéquat au regard des échanges antérieurs.

La société ne saisit pas cette opportunité. Elle adresse une simple « demande de précisions » en soutenant avoir déjà tout transmis et en s’enquérant de ce que la cour jugerait encore insuffisant, sans produire les éléments requis ni caractériser concrètement l’existence de secrets d’affaires ni, a minima, transmettre ces éléments sensibles à la juridiction pour la pesée d’intérêts. La BVwG constate cette carence, relève que sa requête du 22 avril 2025 était détaillée et sans ambiguïté, et note que l’obligation – dégagée par la CJUE – de transmettre les informations « sensibles » à l’autorité ou au juge pour arbitrage ne souffre pas d’exception générale. Dans ces conditions, l’argument du secret d’affaires demeure non étayé.

Au fond, la cour procède alors à une double analyse, portant d’abord sur l’information relative aux finalités du traitement, ensuite sur l’information « significative » quant à la logique, la portée et les effets visés de la décision automatisée. Sur le premier point, elle retient que la société n’a pas fourni, de manière concrète et intelligible pour la personne concernée, des indications suffisamment déterminées sur les finalités poursuivies par chaque traitement. Les déclarations générales selon lesquelles la société « fournit des informations de crédit » et « des informations marketing », assorties d’énumérations génériques de catégories de données susceptibles d’être traitées, ne satisfont pas l’article 15, §1, let. a, qui requiert une explication ciblée et compréhensible des finalités effectivement mises en œuvre pour la personne et les données en cause. Cette lacune fonde, à elle seule, un constat de violation du droit d’accès.

Sur le second point, au regard de l’article 15, §1, let. h, ls BVwG se réfère aux enseignements de la CJUE dans l’affaire C-203/22 : l’obligation porte sur une véritable explication du mécanisme de décision automatisée, appliqué en l’espèce, et du résultat obtenu. En l’occurrence, les éléments communiqués par la société restent purement généraux et illustratifs ; ils n’indiquent pas, pour la personne du plaignant, quelles données ont été retenues, comment elles ont pesé dans le calcul, ni comment la valeur 2,02 et l’« Ampelscore » 2 ont été obtenus, ni quelle variation des données aurait modifié le résultat. La cour retient que l’information fournie n’est ni suffisamment transparente ni suffisamment traçable et ne permet pas l’exercice effectif des droits prévus à l’article 22, §3. Elle souligne que la société n’a pas davantage démontré l’existence d’un secret d’affaires à protéger ni mis en place le canal de transmission confidentielle au juge pour permettre, le cas échéant, une décision de divulgation partielle. La conséquence est un nouveau constat de violation, cette fois de l’article 15, §1, let. h.

La décision examine aussi les arguments de la société tirés de l’absence d’« effet significatif » sur la personne concernée en cas d’usage du score dans la vente à distance. La cour relève que le débat sur l’applicabilité de l’article 22 RGPD, dans sa dimension « décision produisant des effets juridiques ou affectant de manière significative », n’épuisait pas la question de l’article 15 : même lorsque l’on discute l’ampleur des effets, l’article 15, §1, let. h confère à la personne un véritable droit à l’explication du procédé et du résultat, précisément afin de pouvoir, le cas échéant, contester la décision automatisée et présenter son point de vue. En d’autres termes, l’accès explicatif précède et rend possible la discussion sur l’ampleur des effets. La société, qui se bornait à affirmer la nature e-commerce des traitements et le caractère supposément mineur des conséquences, ne pouvait se dispenser d’expliquer ce qu’elle avait effectivement fait avec les données du plaignant pour produire les scores transmis à ses partenaires.

La BVwG tient également compte d’éléments de fait précis mis au jour pendant l’instruction. Il est établi que la société a, par le passé, calculé et transmis des scores concernant le plaignant, qu’elle dit ne pas avoir stockés mais dont les journaux d’accès et résultats de requête sont conservés pendant sept ans, et qu’elle a qualifié la solvabilité du plaignant de « très bonne ». Elle a aussi décrit, de manière générale, des facteurs entrant dans le calcul, parmi lesquels des éléments issus du contexte de solvabilité (expériences de paiement, procédures d’encaissement, enchères immobilières, faillites), des données d’environnement d’entreprises liées et des données sociodémographiques, avec une pondération notable pour le revenu, la façon de payer et la branche d’activité ; toutefois, aucune déclinaison concrète et intelligible n’a été fournie pour le cas d’espèce, ni aucune explication permettant de comprendre comment ces facteurs se sont combinés pour produire les valeurs communiquées. Cela confirme, selon la cour, le caractère insuffisant de l’accès.

S’agissant du dispositif, la BVwG admet donc la plainte dans la mesure où il constate deux manquements : absence d’informations adéquates sur les finalités au sens de l’article 15, §1, let. a, et absence d’informations « significatives » au sens de l’article 15, §1, let. h sur la logique, la portée et les effets visés de la décision automatisée qu’implique le calcul des scores de solvabilité. Il enjoint à la société de fournir, dans un délai de quatre semaines, sous peine d’exécution, une réponse suffisamment déterminée sur les finalités et une explication répondant aux critères européens sur la logique, la portée et les effets recherchés, en lien concret avec la situation du plaignant.

En résumé, la BVwG s’appuie explicitement sur la « pédagogie » exigée par la CJUE : l’explication ne consiste ni à livrer une formule mathématique ni à détailler chaque micro-étape d’un calcul statistique, mais à décrire les procédures et principes effectivement appliqués, de façon à rendre intelligible l’usage des données personnelles et la formation du résultat, et à indiquer, au besoin, comment des variations des données considérées influeraient sur l’issue. Cette explication doit être assez concrète pour armer la personne concernée en vue de l’exercice de ses droits, notamment la contestation et la présentation de son point de vue. D’autre part, la cour rappelle que l’argument du secret d’affaires déclenche, non un refus général, mais un mécanisme procédural : la transmission à l’autorité de contrôle ou au juge de ce qui est confidentiel, pour une pesée d’intérêts et une éventuelle communication partielle.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans Protection des données, RGPD | Tagué , , , , , | Laisser un commentaire

La protection des œuvres créées avec l’assistance de l’IA

Quelques réflexions tirées de P. Bernt Hugenholtz, Copyright and the Expression Engine : Idea and Expression in AI-Assisted Creations, Chi.-Kent L. Rev. Vol. 100, issue 1 (https://scholarship.kentlaw.iit.edu/cklawreview/vol100/iss1/11/):

L’article « Copyright and the Expression Engine: Idea and Expression in AI-Assisted Creations » de P. Bernt Hugenholtz, publié en 2025 dans la Chicago-Kent Law Review, revisite, à l’ère des modèles génératifs, les conclusions d’une étude de 2020 commandée par la Commission européenne à l’Institut de droit de l’information de l’Université d’Amsterdam (IViR).

L’auteur se concentre sur les questions doctrinales relatives à la titularité et à l’étendue de la protection des œuvres assistées par l’IA, en les confrontant aux lignes directrices récentes du Copyright Office américain (USCO) et aux premières décisions nationales, avec l’ambition de montrer que le cadre européen existant reste apte à appréhender la plupart des situations et que, même avec les systèmes génératifs, la marque de l’auteur humain peut et doit être identifiée dans l’œuvre finale.

Il rappelle d’abord le contexte de 2019-2020 : mandaté pour évaluer la nécessité d’une intervention législative, l’IViR a conclu que le droit de l’UE, tel qu’interprété par la Cour de justice (CJUE), offrait déjà des outils suffisants pour traiter les productions assistées par l’IA. La Commission a repris cette conclusion dans son Plan d’action PI de 2020.

La méthodologie retenue reposait sur quatre critères cumulés pour qualifier une « oeuvre » : appartenance au domaine littéraire, scientifique ou artistique au sens de la Convention de Berne, apport intellectuel humain, existence de choix créatifs humains, et expression de ces choix dans le résultat. En pratique, le débat se cristallise sur les troisième et quatrième critères. Pour structurer l’analyse, l’étude distinguait trois moments du processus créatif : la conception (spécifications, choix de style et de moyens), l’exécution (production des brouillons) et la rédaction/finalisation (sélection, montage, corrections, finalisation). L’exécution peut être largement automatisée, mais la conception et la rédaction restent des espaces d’expression humaine. À titre illustratif, « The Next Rembrandt » pouvait, selon ce cadre, être protégé, alors qu’un compte rendu sportif généré automatiquement sans retouches substantielles ne le serait pas ; l’auteur serait en principe l’utilisateur du système, le développeur ne devenant co-auteur qu’en cas de collaboration spécifique.

Puis l’article situe ce cadre face au « tournant » de l’automne 2022 : l’explosion des IA génératives a radicalisé les débats, surtout aux États-Unis, où l’USCO limite fortement l’enregistrement d’œuvres assistées par IA et exige de « dé-revendiquer » les segments jugés « générés ». En Europe, on compte peu de contentieux, ce que l’auteur relie à l’absence de formalités d’enregistrement ; la question de la protection se règle en bout de chaîne devant les tribunaux nationaux. On relèvera une décision tchèque (Taubel Legal) qui refuse la protection à une image obtenue par un prompt générique, ainsi qu’un écho d’une décision de la Beijing Internet Court allant en sens inverse dans un cas plus élaboré.

La première objection doctrinale examinée est celle du « manque de contrôle créatif » du prompteur. L’USCO, s’appuyant notamment sur le dossier « Zarya of the Dawn », estime que les prompts se bornent à indiquer le but à une machine qui décide des éléments expressifs, si bien que l’utilisateur ne serait pas le « maître d’œuvre » de l’image finale. L’auteur concède que, si l’intervention humaine se limite à un prompt simple et isolé, l’œuvre finale n’exprimera pas nécessairement des choix créatifs humains identifiables. La décision tchèque illustre cette hypothèse : un prompt du type « montrer deux mains signant un contrat dans un bureau à Prague » relève davantage de l’idée que de l’expression et ne suffit pas. Mais il souligne que cette description est réductrice par rapport aux pratiques réelles : dans de nombreux flux de travail, l’utilisateur intervient de manière créative à l’amont (conception fine : genre, style, sujet, structure, contraintes) et à l’aval (rédaction : tri de sorties multiples, retouches, cadrage, recadrage, correction des couleurs, montage, réécriture), avec des allers-retours itératifs qui resserrent progressivement la « distance créative » entre prompts et expression finale. Dans ces conditions, les « empreintes » de l’auteur humain sont omniprésentes dans le résultat, au point de rencontrer l’exigence d’originalité telle que conçue par la CJUE (à l’instar de Painer pour la photographie), même si la phase d’exécution est déléguée à la machine.

Il développe ensuite que la « redaction» (finalisation / adaptation etc.) est décisive mais souvent sous-estimée : sélectionner parmi des brouillons, accepter une version comme étant la sienne, la transformer et la finaliser sont autant de choix esthétiques et techniques susceptibles, selon les cas, de suffire à caractériser l’originalité de l’ensemble. Cette lecture, déjà admise pour des œuvres où l’appareil joue un rôle structurant (photographie, cinéma), demeure pertinente lorsque la génération intermédiaire est assurée par un système d’IA. Ainsi, si un simple amateur qui se contente d’un prompt unique risque de ne rien revendiquer, mais un créateur qui enchaîne des centaines de prompts, affine la direction artistique et remanie l’output réalise une contribution personnelle reconnaissable.

La deuxième grande controverse est la place de la distinction idée/expression dans un « système de droits fondé sur les prompts ». Mark Lemley soutient que l’IA générative déplace l’originalité vers des « idées et concepts de haut niveau » et ébranle le test d’atteinte fondé sur la similarité d’expression. Hugenholtz admet que l’IA met au défi ce clivage fondamental, mais il rappelle que l’« expression » ne se réduit pas à la couche syntaxique visible produite par la machine. L’expression juridiquement protégée inclut, depuis longtemps, des niveaux plus abstraits et structurels : intrigue d’un récit, sélection et arrangement d’éléments, architecture d’un logiciel. La doctrine allemande décrit une « forme externe » et une « forme interne » (Gewebe) où réside l’essence de l’œuvre ; transposée à l’IA, la forme interne peut résulter d’itérations de prompts, tandis que la forme externe est partiellement machinique. Entre l’idée pure et l’expression matérialisée, il existe un continuum, plus difficile à baliser dans les arts visuels et la musique que dans l’écrit informatif. Pour des créations fortement conceptuelles (art conceptuel, ready-mades), le droit admet déjà des protections « minces » qui se concentrent sur la reproduction à l’identique ; de même, des œuvres issues de prompts minimaux pourraient n’emporter qu’une protection étroite, quand des productions itératives et « rédigées » se rapprocheraient de l’ampleur de protection des œuvres traditionnelles.

Ce raisonnement s’accompagne d’une mise en garde pratique : il ne s’agit pas de transformer toute intention artistique en monopole large au stade de l’idée, mais de reconnaître, selon l’intensité et la localisation de l’apport humain, une protection proportionnée. Là où l’intervention s’arrête à une intention générique et à un choix parmi quelques variantes, la protection doit rester mince ; là où l’auteur a véritablement façonné l’œuvre par une direction conceptuelle précise et un travail de rédaction substantiel, la protection peut couvrir des variantes plus éloignées, comme c’est le cas pour la photographie d’auteur ou le montage filmique. Cette approche évite d’étouffer le domaine public d’idées tout en ne désarmant pas les créateurs face à des appropriations opportunistes.

La troisième question porte sur la contrefaçon et la preuve de la copie. L’argument de Lemley est que la similarité n’indiquerait plus la copie, puisqu’un tiers pourrait, par d’autres prompts, aboutir à un résultat ressemblant. Hugenholtz distingue : si l’œuvre reprochée provient d’un prompt simple et non retouché, la probabilité d’une « double création » indépendante n’est pas négligeable et, de toute manière, la protection devrait être faible ou inexistante faute d’originalité suffisante. En revanche, plus le processus est itératif et rédigé, plus la probabilité d’une recréation indépendante chute, comme pour les œuvres classiques. Par ailleurs, les outils génératifs conservent souvent des historiques de prompts, ce qui peut objectiver l’enquête sur l’indépendance. Enfin, les obligations de transparence de l’AI Act de l’UE relatives au marquage des contenus synthétiques et à la conformité au droit d’auteur peuvent faciliter, à l’avenir, l’instruction et la prévention, de même que la mise en place de garde-fous techniques par les fournisseurs.

Sur la méthode d’attribution et la titularité, l’article maintient la présomption en faveur de l’utilisateur humain qui a contribué de manière créative ; le fournisseur de modèle n’est pas auteur par défaut, sauf contribution créative au cas d’espèce justifiant une co-auteurité. Ce positionnement répond autant à la logique juridique qu’aux réalités commerciales : il serait dissuasif pour les marchés que les développeurs revendiquent systématiquement des droits en aval sur chaque sortie. Pour un praticien suisse, familier des principes de la Convention de Berne, cette clé de répartition est intelligible : on identifie l’apport humain original exprimé dans le résultat et on rattache la paternité à celui qui l’a fixé dans la forme, en appréciant les faits du dossier.

Dans ses remarques finales, Hugenholtz critique la politique américaine de « dé-revendication » systématique de toute part « plus que de minimis » générée par IA : si l’œuvre mature porte la marque de l’auteur à tous les stades, exiger de séparer une fraction « machine » devient irréaliste et anachronique. L’analogie avec la photographie est parlante : l’appareil a toujours « généré » des aspects essentiels de l’image sans que l’on exige des photographes qu’ils déclarent ces éléments comme non protégeables. Or l’IA s’intègre désormais aux appareils (par exemple, dans les smartphones), automatisant des choix techniques et esthétiques ; il serait absurde d’obliger les créateurs à désosser ces contributions intégrées. L’auteur anticipe aussi une évolution de l’interface créateur-machine : les prompts génériques céderont le pas à des « moteurs d’expression » permettant un contrôle plus direct et plus fin, renforçant encore la traçabilité de l’apport humain.

Au total, le raisonnement se déroule en plusieurs étapes cohérentes. D’abord, les critères et la grille « conception–exécution–rédaction » issus de l’étude IViR restent utiles pour apprécier l’originalité et l’attribution à l’ère de l’IA, autant en Europe qu’aux États-Unis si l’on accepte l’analogie avec la photographie et le cinéma. Ensuite, l’objection du « manque de contrôle » ne tient pas lorsque l’on observe les pratiques itératives, où le rôle humain façonne effectivement l’œuvre à l’amont et à l’aval, même si l’exécution est automatisée. Puis, la dichotomie idée/expression, loin d’être détruite, doit être raffinée : l’expression comprend aussi des couches internes, abstraites et structurelles, déjà admises par la doctrine et la jurisprudence, ce qui autorise une protection proportionnée selon l’intensité de l’apport humain. Enfin, du côté de la contrefaçon, la similarité redevient probante dès lors que l’œuvre revendique une trajectoire créative riche, appuyée demain par des journaux de prompts et des marquages imposés ; les rares cas de double création apparaîtront surtout dans la zone des prompts simples, où la protection devrait de toute façon être limitée. L’ensemble conduit à recommander, pour les contentieux et pour les politiques publiques, d’évaluer la contribution humaine là où elle se trouve réellement, c’est-à-dire dans la direction créative et la mise en forme finale, plutôt que d’ériger une frontière abstraite entre « machine » et « humain » que ni l’histoire des techniques ni la pratique artistique ne justifient.

(L’article est paru dans les actes du colloque AI Disrupting, sous la direction du Professeur Edward Lee, Chicago – Kent Law Revie, vol.  100, Issue 1 (2025), en libre accès ici : https://scholarship.kentlaw.iit.edu/cklawreview/)

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans droit d'auteur, intelligence artificielle | Tagué , , , | Laisser un commentaire

Travailleurs de l’IA: une rémunération à la tâche ?

Le salaire à la pièce ou à la tâche se caractérise par le fait que le travailleur est rémunéré en fonction de la quantité de travail fournie, et non en rapport au temps mis à disposition de l’employeur. Il ne s’agit pas pour autant d’une situation qui pourrait se voir qualifiée de contrat d’entreprise, car le salarié reste pris dans un rapport de subordination économique et de dépendance juridique envers l’employeur, et il n’est pas tenu non plus par une obligation de moyens mais bien de résultats.

Les dispositions relatives au travail aux pièces ou à la tâche apparaissent vieillies, ou réservées à certains secteurs économiques très particuliers (certaines spécialités dans l’horlogerie par exemple, pour des raisons surtout historiques). C’est oublier que les art. 326-326a CO peuvent aussi tout à fait s’appliquer à des travaux de la nouvelle économie numérique, par exemple dans l’entraînement de l’intelligence artificielle, et qui prévoirait des rémunérations au nombre de « clics », d’évaluations, d’annotations de données, etc. (cf. A.WITZIG, « Art. 326 CO », in L. THEVENOZ/ F. WERRO (édit.), Commentaire romand : Code des obligations I, Bâle 2021, N 4.)

On a souvent soutenu, à raison, que ces tâches sont essentiellement sous-traitées dans le tiers monde, à des conditions souvent contestables. C’était vrai, et cela le demeure largement, mais les modèles d’entrainement ont aussi besoin de prestataires plus sophistiqués ou plus formés, et cela entraîne que ces tâches peuvent aussi, même si dans une moindre mesure, être pratiquées dans les pays développés concernant des questions techniques ou faisant appel à des savoirs particuliers.

Les art. 326 et 326a CO traitent donc spécifiquement des situations où le travailleur est rémunéré aux pièces ou à la tâche.

L’art. 326 CO traite d’abord de la fourniture de travail en cas de travail aux pièces ou à la tâche.

Le risque d’un tel type contrat repose précisément dans l’absence de travail confié, et donc dans l’absence de rémunération et dans l’insécurité qi en résulte pour le travailleur. A teneur de l’art. 326 al. 1 CO, lorsqu’en vertu du contrat le travailleur travaille exclusivement aux pièces ou à la tâche pour un seul employeur, celui-ci doit donc lui fournir du travail en quantité suffisante. Cela signifie que le travailleur doit se voir confier de quoi pouvoir réaliser un revenu pendant toute la durée du temps de travail contractuel.

L’employeur peut charger le travailleur d’un travail payé au temps lorsque les conditions de l’exploitation l’exigent momentanément ou qu’il se trouve, sans faute de sa part, dans l’impossibilité de fournir le travail aux pièces ou à la tâche prévue par le contrat (art. 326 al. 2 CO). Cette disposition rappelle que le salaire au temps est la norme, à laquelle il est possible de revenir nonobstant les dispositions contractuelles dans certaines hypothèses.  Si le salaire payé au temps n’est pas fixé dans un accord, un contrat-type de travail ou une convention collective, l’employeur doit verser au travailleur l’équivalent du salaire moyen aux pièces ou à la tâche qu’il gagnait jusqu’alors (art. 326 al. 3 CO). Enfin, l’employeur qui ne peut pas fournir suffisamment de travail aux pièces ou à la tâche ni de travail payé au temps, n’en reste pas moins tenu, conformément aux dispositions sur la demeure, de payer le salaire qu’il devrait verser pour du travail payé au temps (art. 326 al. 4 CO).

L’art. 326 CO est applicable par analogie au travail sur appel. L’idée est la même : l’employeur ne doit pas pouvoir, unilatéralement, décider en fonction de ses seuls besoins, de la durée du travail et de la rémunération du travailleur. (ATF 125 III 65 consid. 5, p. 70)

L’art. 326a CO traite quant à lui de l’information relative au taux de rémunération.

Lorsqu’en vertu du contrat le travailleur travaille aux pièces ou à la tâche, l’employeur doit donc lui indiquer le taux du salaire avant le début de chaque travail (art. 326a al. 1 CO). Si l’employeur omet de donner ces indications, il paye le salaire selon le taux fixé pour un travail identique ou analogue (art. 326a al. 2 CO).

L’idée est d’éviter que le travailleur ne puisse estimer sa rémunération, et soit empêché de prendre les décisions de la vie quotidienne en rapport.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans intelligence artificielle, Qualification du contrat, Salaire | Tagué , , , , , , | Laisser un commentaire

IA : la diffamation par hallucination des Large Language Models

Quelques réflexions tirées de L. BARNETT LIDSKY/ A. DAVES, Inevitable Errors: Defamation by Hallucination in AI Reasoning Models (forthcoming in the Journal of Free Speech Law 2025) 25 juillet 2025 (texte disponible ici : https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5362314):

L’étude s’ouvre sur un constat: les modèles de langage (LLM) progressent vite et s’installent comme outils de recherche, d’analyse et de rédaction. Les auteurs rappellent l’ambivalence du débat public — utopie d’abondance contre crainte d’accidents sociétaux — mais notent surtout l’usage déjà massif des LLM dans des tâches précises où ils rivalisent par endroits avec l’humain. Ils insistent toutefois sur une propriété clef : ces systèmes génèrent du texte probabiliste, non une « vérité », et produisent inévitablement des contenus « plausibles mais faux », les fameuses « hallucinations ». Celles-ci peuvent prendre la forme de biographies inventées, de citations juridiques apocryphes ou d’écrits judiciaires fictifs. Les éditeurs de modèles peuvent réduire la fréquence de ces sorties, mais pas les éliminer, et les données disponibles suggèrent des taux non négligeables d’erreur selon les contextes. De là naît le problème spécifique de la « diffamation par hallucination » : que faire quand un modèle, répondant à un prompt, « affirme » un fait déshonorant et faux sur une personne ?

Les auteurs soutiennent que le droit de la diffamation, déjà façonné par des siècles d’adaptation aux médias successifs, doit évoluer encore, mais de manière à préserver l’utilité des outils tout en indemnisant les atteintes démontrables.

Pour mettre ce défi en perspective, la Partie I analyse l’affaire Walters v. OpenAI, première décision américaine substantielle sur la diffamation par LLM. En mai 2023, un journaliste interroge ChatGPT à propos d’un litige réel, mais la conversation dévie : le modèle se met à fabriquer un « document » judiciaire accusant le présentateur radio Mark Walters de fraude et de détournement de fonds au détriment d’une association. Le journaliste, qui dispose de documents contredisant cette version, sollicite plusieurs réponses, essuie des excuses et avertissements répétés du modèle sur ses limites, puis contacte Walters ; aucune autre personne ne reçoit la sortie litigieuse. Walters poursuit néanmoins OpenAI en diffamation. Le 19 mai 2025, la juridiction d’État en Géorgie accorde un jugement sommaire à OpenAI. L’ordonnance retient essentiellement que la sortie n’était pas raisonnablement « compréhensible comme factuelle » dans ce contexte truffé de dénégations, d’incohérences et d’indices et que les éléments produits ne confirment pas un préjudice réputationnel effectif. Les auteurs, tout en approuvant l’issue au regard des faits, en pointent les limites conceptuelles et pédagogiques pour les dossiers à venir.

Sur le premier point, la décision estime que, lue « dans son ensemble », la conversation ne pouvait être prise pour un énoncé factuel crédible sur Walters. L’importance pratique est double : d’une part, les avertissements, refus d’obtempérer et contradictions internes du modèle comptent dans l’analyse ; d’autre part, la croyance subjective du récipiendaire (ici le journaliste) — qui n’y a pas cru et a immédiatement vérifié — renforce l’idée d’une absence de « déclaration factuelle » aux yeux d’un lecteur raisonnable. Les auteurs approuvent cette approche pour ce cas précis, tout en avertissant qu’on ne peut en déduire une règle générale neutralisant toute responsabilité des LLM : dans d’autres circonstances, des mises en garde génériques ne suffiraient pas, surtout si des éditeurs vantent parallèlement la fiabilité de leurs produits ou si les usages anthropomorphisent la machine. L’élément clef reste l’examen concret du contexte de publication et de réception.

Sur la faute (« scienter »), l’arrêt rappelle les jalons constitutionnels américains : pour un demandeur public, la preuve d’une connaissance de la fausseté ou d’une indifférence téméraire est exigée. Appliquée à un fournisseur de LLM, cette exigence devient épineuse : une machine n’a pas d’« état d’esprit », et la « décision » d’émettre l’énoncé ne peut être qualifiée d’imprudence humaine. Le tribunal a donc déplacé l’analyse vers la conduite des humains en amont — conception, entraînement, tests, avertissements — et, sur pièces, a jugé ces diligences suffisantes. Les auteurs y voient une première translation de la diffamation vers une logique de « produit » : si faute il y a, elle se prouverait par une expertise sur les choix de design et de gouvernance du modèle, non par une intention éditoriale au moment de « publier » un propos sur un individu. Cela soulève la question pratique du coût de la preuve pour des plaignants individuels et de la volatilité des versions de modèles, ce qui rend fragile la transposition directe des standards classiques du Premier Amendement.

La décision Walters évoque aussi la question des dommages. En droit américain, certaines catégories de diffamation autorisent des dommages « présumés », en reconnaissance de l’insaisissabilité de certaines atteintes relationnelles. Mais quand les éléments établissent que personne d’autre n’a reçu la sortie, que le destinataire n’y a pas cru et que le plaignant n’a pas subi de conséquences concrètes, la base d’une présomption s’effrite. Ici, la capacité d’OpenAI à produire l’historique exact des prompts a joué un rôle probant : elle a permis de démontrer l’absence de diffusion et, partant, la faiblesse du dommage. Les auteurs y voient une piste de politique publique : imposer la conservation proportionnée des logs de requêtes pendant une durée limitée pour objectiver l’étendue d’une diffusion et la réalité du tort.

Enfin, la Partie I aborde un « chemin non pris » par le juge : l’angle de la « publication ». En diffamation, il faut qu’au moins un tiers reçoive l’énoncé. Mais au-delà de ce minimum, le régime de responsabilité varie selon que l’acteur est « éditeur » (publisher) ou « distributeur » : bibliothèques, kiosques et télégraphes ont historiquement bénéficié d’un régime atténué tant qu’ils n’avaient pas connaissance effective du caractère diffamatoire. Les auteurs proposent d’assimiler les producteurs de LLM à des « distributeurs » : ils fournissent un outil qui, à la demande d’un usager, recompose de l’information, sans exercer un contrôle éditorial classique ni garantir la vérité du contenu. Par analogie avec la jurisprudence télégraphique, le droit commun a su exonérer des intermédiaires non passifs quand l’examen ex ante du flux serait impraticable et quand l’intervenant le plus efficace est l’émetteur initial — ici, souvent, l’utilisateur qui « relaye » ensuite le propos. Cette qualification guiderait un équilibre plus juste entre liberté de communiquer et protection de la réputation.

La Partie II délaisse les « fondation models » pour décrire l’essor des « reasoning models », notamment ceux qui exposent une « chaîne de pensée » (chain-of-thought, CoT). Ces systèmes entreprennent une résolution pas-à-pas, parfois avec « double vérification » interne, et promettent des résultats finaux plus exacts. Mais ils introduisent une nouvelle zone de risque : des hallucinations potentiellement diffamatoires peuvent apparaître non pas dans la réponse finale, mais dans les étapes intermédiaires affichées à l’utilisateur, par exemple en nommant des personnes à tort comme auteurs de faits répréhensibles au stade de la « vérification », puis en corrigeant finalement le tir. D’un point de vue responsabilité, ces « micro-hallucinations » exposées créent des vecteurs supplémentaires d’atteinte si elles sont vues, conservées ou réutilisées. Les auteurs citent même des cas où ces CoT auraient aidé le modèle à éviter une erreur finale, ce qui complique davantage le diagnostic juridique : faut-il censurer l’affichage des CoT pour éviter les diffamations intermédiaires au risque de perdre un puissant mécanisme d’audit et d’amélioration de la sûreté ? Leur réponse est prudente : une censure systématique des CoT réduirait la capacité de contrôle et pourrait dégrader la sécurité globale, même si des garde-fous s’imposent.

La même Partie II introduit une taxonomie utile pour les praticiens : des chercheurs de Yale distinguent trois types d’hallucinations — celles infidèles au prompt de l’utilisateur, celles non dérivables du corpus d’entraînement, et celles contraires aux faits du monde. Chacune pose des problèmes différents en diffamation. Quand le modèle résume un document fourni et « déforme » un passage au détriment d’une personne, l’utilisateur a souvent en main la source permettant de vérifier ; fonder une responsabilité lourde du fournisseur de LLM pour une « infidélité au prompt » alors que l’usager pouvait contrôler paraît discutable. À l’inverse, les hallucinations « hors-corpus » peuvent être, paradoxalement, une source de créativité utile, l’outil « pensant autrement » en recombinatoire, mais deviennent dangereuses si elles attribuent des faits pénaux. Enfin, les hallucinations « contra factum » sont les plus délicates : elles produisent de fausses assertions identifiantes sur des personnes — le terrain classique de la diffamation. Les auteurs insistent que, techniquement, la combinaison de probabilité linguistique, de biais et d’incomplétudes de données, et de « volonté » du modèle de « faire plaisir » en comblant les trous explique l’inévitabilité des erreurs. Vouloir les éradiquer totalement reviendrait à sacrifier des fonctions créatives et, en définitive, l’utilité du médium.

Cette inévitabilité a des corollaires normatifs importants. D’abord, l’amélioration continue est réelle — avec la récupération augmentée (RAG), les modèles « montrent leurs sources » et permettent des vérifications en ligne, tandis que les chaînes de pensée offrent une forme d’auto-contrôle — mais elle n’est ni linéaire ni définitive. Ensuite, la transparence de conception et l’ouverture de la recherche favorisent l’innovation sûre ; enfin, certaines hallucinations peuvent être « précieuses » dans des usages créatifs ou heuristiques, y compris pour la pratique juridique, pourvu que l’utilisateur adopte une discipline de « trust but verify ». Ces éléments invitent à calibrer la réponse juridique : punir indistinctement chaque hallucination diffamatoire du modèle risquerait de « geler » un médium informationnel prometteur, sans pour autant mieux protéger les victimes.

La Partie III propose alors des objectifs de politique de communication pour guider l’adaptation du droit de la diffamation à ces systèmes. Le premier est d’indemniser les victimes pour des préjudices prouvables ; le second, de faciliter la correction de l’« ardoise numérique » ; le troisième, d’encourager la transparence et l’innovation en matière de sécurité et d’exactitude ; le quatrième, d’exiger une diligence raisonnable à tous les stades de la chaîne — développeurs, intégrateurs et utilisateurs finaux. Les auteurs insistent sur la nécessité d’un équilibre : ces buts sont en tension et ne relèvent pas tous de la common law de la diffamation. Pour certains, des instruments législatifs ou réglementaires sont plus adaptés, d’autant que la diffamation n’est pas l’outil optimal pour réguler les systèmes d’IA à haut risque extra-informationnels. Mais s’agissant des atteintes réputationnelles issues de sorties textuelles, il est possible d’avancer sans sacrifier la « respiration » du débat public.

Dans cette veine, une proposition concrète concerne l’obligation d’informer : en tort (responsabilité civile) pure, imposer uniformément un devoir d’avertir tous les utilisateurs sur l’ampleur et la nature des hallucinations est peu efficace et fragile. Une voie plus droite passe par la loi : instaurer un devoir statutaire de transparence et d’éducation des utilisateurs, potentiellement articulé à une immunité corrélative, pour généraliser des mises en garde claires sur la vérification indispensable des sorties. Une autre proposition est la conservation limitée des données de requêtes, afin de permettre aux victimes de prouver l’existence et surtout l’étendue de la diffusion d’une sortie diffamatoire ; cette mesure devrait être calibrée temporellement pour limiter les risques de sécurité et de confidentialité. Ces leviers législatifs ont un avantage : ils renforcent la prévention et l’administration de la preuve, plutôt que de compter ex post sur des dommages « présumés » difficilement justifiables lorsque la diffusion est nulle ou marginale.

La Partie IV articule le cadre normatif proposé. Les auteurs suggèrent de traiter les hallucinations diffamatoires — qu’elles surviennent dans la réponse finale ou dans la chaîne de pensée — comme des « erreurs inévitables », à la manière dont la Cour suprême américaine, dans New York Times v. Sullivan, a reconnu que certaines erreurs journalistiques doivent être tolérées pour garantir un débat public « vigoureux et sans entraves ». À partir de là, ils plaident pour une transposition prudente des catégories de responsabilité : assimiler les producteurs de LLM à des « distributeurs » d’information, non à des éditeurs, afin d’éviter d’exiger d’eux un contrôle préalable impossible et de placer la charge principale sur les acteurs les mieux placés pour éviter le tort — souvent l’utilisateur qui répète la fausse allégation sans vérifier. Cette position est cohérente avec l’histoire du droit de la diffamation face au télégraphe : les tribunaux ont reconnu des privilèges larges aux opérateurs, sauf connaissance effective de la malice du message. Dans le monde des LLM, où le fournisseur propose un outil algorithmique qui « remixe » des informations à l’initiative d’un usager, une responsabilité de « distributeur » avec régime de connaissance est, selon les auteurs, adaptée aux objectifs de politique de communication.

Ce basculement s’accompagne de trois pièces complémentaires. Premièrement, un devoir légal de mise en garde et d’éducation des utilisateurs, visible et opérationnel, pour ancrer la norme d’usage « vérifier avant de relayer ». Deuxièmement, une obligation de conservation proportionnée des historiques de requêtes, afin d’objectiver la diffusion et d’éclairer l’évaluation du dommage — mesure qui bénéficierait autant aux demandeurs qu’aux défendeurs en clarifiant rapidement les faits. Troisièmement, une réactivation sans complexe de la responsabilité de l’utilisateur-relais : celui qui reprend une sortie diffamatoire sans diligence est souvent le « cheapest cost avoider », c’est-à-dire l’acteur au moindre coût d’évitement, et doit répondre, comme on le fait déjà pour des journalistes relayant sans vérification une source non fiable. Autrement dit, le droit de la diffamation garderait sa vocation à discipliner les comportements humains fautifs, tandis que la conception, l’entraînement et l’opération d’outils intrinsèquement faillibles seraient régulés par des devoirs d’information, de gouvernance et de traçabilité.

Un élément particulièrement fin du cadre concerne les chaînes de pensée. Les auteurs mettent en garde contre une tentation compréhensible : supprimer l’affichage des CoT pour éviter les diffamations « intermédiaires ». Ce remède, expliquent-ils, saperait un mécanisme déterminant de monitoring de sûreté et de compréhension des erreurs. Pour que les CoT servent à la détection et à la correction des comportements indésirables, elles doivent être « fidèles » au processus décisionnel du modèle. Autrement, on perd l’information nécessaire pour auditer, et on réduit la possibilité de corriger les risques systématiques. L’optimum, suggéré par l’article, réside plutôt dans des garde-fous ciblés et des politiques utilisateur claires, combinés à la qualification « distributeur » et au recentrage de la responsabilité sur la republication non vérifiée par des humains.

La conclusion récapitule la philosophie générale. À chaque révolution médiatique — presse, télégraphe, radio, télévision, internet — le droit américain de la diffamation a modulé ses outils pour ne pas étouffer le médium tout en protégeant la dignité et la réputation. Les LLM raisonnants imposent une nouvelle adaptation : reconnaître que des erreurs diffamatoires surgiront malgré toutes les précautions, les traiter comme des « erreurs inévitables » inhérentes au média, placer sur les producteurs un devoir d’alerte et de traçabilité qui améliore la prévention et la preuve, puis traiter juridiquement les éditeurs de modèles comme des « distributeurs » plutôt que des « éditeurs ». Corrélativement, faire peser la responsabilité principale sur les usagers qui, en connaissance des limites, relaient des allégations graves sans vérification raisonnable. Les auteurs revendiquent une approche modeste et ciblée : il ne s’agit pas d’un programme général de régulation de l’IA, mais d’un ajustement de la diffamation à une classe d’atteintes réputationnelles spécifiques, afin d’allier réparation, correction de l’espace informationnel et maintien d’un espace d’expérimentation sûr et auditable pour un médium appelé à rester.

En définitive, la proposition des auteurs n’invite pas à l’impunité des modèles, mais à un partage des responsabilités conforme à l’économie du risque : des devoirs ex ante d’information et de traçabilité pour les fournisseurs ; une responsabilité de droit commun ciblant l’usager qui publie ou republie ; et, au-dessus, un droit de la diffamation ajusté pour tolérer les « erreurs inévitables » sans renoncer à la réparation des torts prouvés ni à la correction de l’espace numérique. C’est une voie médiane pragmatique, informée par l’histoire des médias et par l’état réel des technologies, qui fournit aux avocats un cadre opérationnel pour conseiller, prévenir et plaider dans un champ appelé à croître.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans Droit pénal, Droit US, intelligence artificielle | Tagué , , , , , | Laisser un commentaire