Les données des employés comme capital capté par les employeurs

Quelques réflexions tirées d’Ifeoma Ajunwa, AI and Captured Capital, Yale Law Journal (2025), pp. 372-404 (https://www.yalelawjournal.org/collection/reimagining-and-empowering-the-contemporary-workforce):

L’auteur analyse la manière dont l’intelligence artificielle et les systèmes automatisés transforment la relation de travail en instaurant une collecte et une exploitation systématiques des données issues de l’activité des travailleurs. Elle désigne ce phénomène par le terme de « captured capital », c’est-à-dire un capital prélevé sur les travailleurs par l’extraction de données qu’ils produisent, souvent sans consentement véritable, et qui est ensuite exploité pour optimiser les processus, former des systèmes automatisés et, à terme, remplacer ces mêmes travailleurs. Ce capital est « capté » ([je dirais plutôt confisqué…]) car il est recueilli dans un contexte de dépendance économique qui laisse peu de marge de refus, et il est un « capital » car il possède à la fois une valeur inhérente – en permettant l’amélioration de la productivité ou l’innovation organisationnelle – et une valeur d’échange – par sa revente à des courtiers en données pour des usages divers.

Pour illustrer ce phénomène, Ajunwa évoque d’abord le recours à des travailleurs kényans chargés de labelliser du contenu toxique destiné à l’entraînement d’un LLM. Leur rémunération, dérisoire au regard de la valeur créée, contraste avec la valorisation considérable du donneur d’ordre. Elle décrit également la situation des acteurs et figurants d’Hollywood, soumis à des scans corporels détaillés par les studios en vue de créer des doubles numériques dont l’usage futur n’est pas précisé, ce qui suscite la crainte d’une substitution pure et simple de leur travail par des avatars. Ces exemples, bien que très différents, traduisent la même logique : la valeur issue du travail humain est transformée en données réutilisables qui enrichissent le capital informationnel des entreprises et renforcent leur capacité à automatiser.

Ajunwa souligne que cette dynamique s’inscrit dans un contexte général de développement accéléré de l’IA, encouragé par une approche de laissez-faire et par la course mondiale aux technologies. Cette compétition, à la fois entre États et entre entreprises, privilégie la rapidité et l’efficacité, relègue au second plan les considérations de justice sociale et laisse se développer des formes de taylorisme algorithmique où chaque aspect de l’activité – rendement, gestes, états physiques et émotionnels – est mesuré et quantifié. L’absence de régulation internationale contraignante [ce qui est à nuancer…] et l’existence d’un marché du travail globalisé permettent de délocaliser des tâches intensives en main-d’œuvre dans des pays à faible protection sociale, tout en exploitant les données ainsi produites pour automatiser ailleurs.

L’auteur insiste sur le fait que les données générées par les travailleurs doivent être envisagées comme un actif durable et réutilisable, comparable à un facteur de production au même titre que les machines ou le capital financier. Sans l’apport de leur travail, il n’existerait pas de matière première informationnelle pour entraîner les systèmes automatisés ou améliorer les processus. Elle mobilise plusieurs fondements juridiques pour soutenir que les travailleurs devraient disposer de droits sur ces données. D’un point de vue de droit naturel, la théorie lockéenne de l’appropriation par le travail justifie que le fruit de l’activité appartienne à celui qui l’a produite. Des textes récents, comme le California Consumer Privacy Act et son amendement par le California Privacy Rights Act, reconnaissent aux travailleurs des droits d’information, d’accès, de rectification et d’opposition concernant leurs données, ce qui implique une forme de reconnaissance de leur légitimité. L’analogie avec la notion de « fiduciaire de l’information » suggère également que l’employeur, dépositaire de ces données, devrait avoir des obligations de loyauté et de diligence envers leurs producteurs.

Ajunwa répond aux objections inspirées du droit de la propriété intellectuelle, notamment la doctrine du « work for hire » ou l’obligation implicite de cession de brevets, en rappelant que ces régimes visent des œuvres ou inventions achevées, et non les données brutes ou intermédiaires issues du processus de production. Elle estime que le droit des sociétés, qui reconnaît la contribution des parties prenantes en capital humain et intellectuel, soutient l’idée que les données produites constituent un investissement des travailleurs dans l’entreprise, lequel ne devrait pas les priver de tout droit de propriété ou de contrôle.

L’analyse est élargie par une approche en termes de droit, de politique et d’économie. Le mouvement Law and Political Economy met en évidence que la neutralité proclamée des pouvoirs publics a en réalité permis aux entreprises de structurer leurs activités dans un sens défavorable aux travailleurs, et que l’argument de l’efficience masque des déséquilibres de pouvoir croissants. Dans le cas de la captation de capital-données, l’absence d’intervention publique favorise une optimisation des structures pour extraire le maximum de valeur des données, sans redistribution ni mécanismes correctifs.

Les effets sur l’emploi sont multiples et concernent désormais des métiers qualifiés et créatifs, comme l’illustre la capacité de LLMs à générer du code, qui a conduit certaines entreprises à réduire leurs effectifs de développeurs. Les prévisions de cabinets comme Goldman Sachs ou McKinsey annoncent des taux d’automatisation élevés d’ici 2030, notamment dans les professions scientifiques, techniques, juridiques ou commerciales. Par ailleurs, les technologies de suivi de productivité, incluant des capteurs et des dispositifs portés par les travailleurs, servent à la fois à optimiser le travail en temps réel et à collecter des données pour entraîner les systèmes qui, à terme, remplaceront ces mêmes travailleurs.

Face à ce constat, Ajunwa formule trois pistes de réforme. La première consiste à traiter les données des travailleurs comme une mise de capital dans les processus d’automatisation, leur donnant droit à une part des gains générés. La deuxième vise à instaurer un régime de licences permettant aux travailleurs de concéder l’usage de leurs données à des conditions négociées, individuellement ou collectivement, à l’image des contrats encadrant l’exploitation de l’image ou de la voix d’un artiste. La troisième prévoit de contraindre les entreprises utilisant ces données à contribuer à un fonds finançant un revenu garanti pour les travailleurs déplacés, fonds qui pourrait être administré par l’Organisation internationale du travail ou par une autre structure internationale.

L’auteur ne nie pas les difficultés pratiques de ces modèles, qu’il s’agisse de mesurer la valeur exacte des données, de coordonner les régimes juridiques nationaux ou d’assurer une gouvernance efficace. Elle soutient néanmoins qu’ils ont en commun de redonner aux travailleurs un contrôle et un bénéfice sur les actifs qu’ils génèrent, de corriger en partie le déséquilibre de pouvoir et de limiter les effets négatifs de l’automatisation rapide. Elle conclut en avertissant que, sans encadrement légal, la trajectoire actuelle mène vers un modèle de gestion scientifique exacerbé par l’IA, où les travailleurs sont réduits à des sources de données exploitables, sans retour sur la valeur qu’ils produisent, et où cette valeur sert à construire les outils qui finiront par les évincer.

Ifeoma Ajunwa est aussi l’auteur du très intéressant The Quantified Worker : Law and Technologiy in the Modern Workplace, Cambridge 2023.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans Droit collectif du travail, droit d'auteur, Droit US, Protection des données | Tagué , , , | Laisser un commentaire

Intelligence artificielle et propriété intellectuelle : un point de situation

Quelques éléments de réflexion tirés de A. Guadamuz, Revisiting copyright infringement in AI inputs and outputs (https://www.technollama.co.uk/revisiting-copyright-infringement-in-ai-inputs-and-outputs – publié le 30 juillet 2025 sur son excellent blog :

L’auteur commence par expliquer que son objectif est de mettre à jour un panorama des problématiques de droit d’auteur à l’ère de l’IA générative après trois années d’expérimentation intensive. Il entend se concentrer sur « l’image d’ensemble » plutôt que sur l’exégèse au fil de l’eau des litiges en cours, afin de dégager des lignes de force juridiques qui se cristallisent autour des phases d’entrée (inputs) et de sortie (outputs) des systèmes d’IA. Son point de départ est pragmatique : beaucoup d’analyses antérieures lui semblent datées, tant les pratiques et la jurisprudence naissante ont évolué, et il propose donc un cadre conceptuel actualisé pour apprécier la licéité des copies réalisées lors de l’entraînement et la licéité des contenus générés.

Pour circonscrire le débat, il définit les « inputs » comme la phase d’entraînement d’un modèle sur d’immenses corpus de données, et les « outputs » comme les résultats produits par un modèle entraîné en réponse à des instructions de l’utilisateur (texte, image, son, vidéo, voix, ou combinaisons). Cette distinction structure toute l’analyse : le contentieux s’est d’abord focalisé sur l’amont (les copies réalisées lors de l’ingestion et du traitement des données d’entraînement), mais l’auteur anticipe que l’aval – la reproduction par les modèles d’éléments protégés – deviendra déterminant à mesure que les systèmes s’améliorent.

S’agissant des inputs, l’auteur insiste sur la réalité technique des procédés d’entraînement : constituer des jeux de données d’une taille vertigineuse suppose inévitablement des actes de reproduction à un moment ou un autre. Une partie des contenus est libre de droits ou non protégeable (données brutes), mais une proportion substantielle est protégée par le droit d’auteur, si bien que la collecte et la préparation des données impliquent des copies relevant prima facie de l’exclusivité de l’auteur. Il rappelle toutefois que, dans un jeu de données massif, la valeur individuelle d’une œuvre donnée tend vers le négligeable, l’intérêt étant la représentativité du corpus, puis son « nettoyage/prétraitement » (élimination de doublons, erreurs et éléments non pertinents, conversion dans un format calculable). À l’issue de ces opérations, les œuvres ne sont plus reconnaissables comme telles : elles sont transposées en données utilisées pour ajuster les paramètres internes du modèle. Cela complique la qualification juridique d’une « utilisation » d’une œuvre particulière, même si l’existence d’un acte de reproduction lors de l’ingestion demeure difficile à nier.

L’auteur vulgarise ensuite, sans entrer dans la technicité excessive, le cœur de l’apprentissage statistique : on « alimente » un réseau de neurones et on ajuste ses poids en minimisant une fonction de perte par des algorithmes d’optimisation répétés des millions de fois. Le résultat est un modèle paramétré qui encode des corrélations, motifs et relations statistiques – et non, en principe, des copies persistantes des œuvres sources. Cette idée – le modèle n’« embarque » pas les œuvres, il en « apprend » des régularités – constitue l’un des éléments qui brouillent les intuitions juridiques classiques : on peine à aligner la perception intuitive d’un « copieur » sur la réalité d’un système qui extrait des régularités puis « oublie » les œuvres individuelles. En pratique, l’« incrimination originelle » des inputs reste l’existence d’une copie à un moment du pipeline ; toute la question est alors de savoir si cette copie peut être juridiquement justifiée.

Sur ce terrain, l’auteur observe qu’aux États-Unis les juridictions semblent, à ce stade, s’orienter vers une appréciation favorable à la défense du fair use pour certains usages de formation de modèles, tout en rappelant qu’un facteur contextuel pèse lourd : la provenance des données. Recourir à des « shadow libraries » ou à des contenus manifestement piratés fragilise substantiellement la défense du fair use, en particulier au regard des facteurs relatifs à la nature de l’utilisation et à son caractère transformatif ou équitable. Autrement dit, la même opération de formation peut basculer d’un côté ou de l’autre selon la source des données : aspirer des contenus licitement accessibles et techniquement balisés n’est pas équivalent à entraîner à partir de corpus acquis par des moyens illégitimes.

Côté Union européenne, l’auteur décrit une mer réglementaire agitée mais en voie d’accalmie autour de l’IA Act et du « Code of Practice » pour les modèles d’IA à usage général présentant un risque systémique (GPAI), défini notamment par un seuil de puissance de calcul dépassant 10^25 FLOPs. Il souligne le caractère volontaire du Code, qui ne s’applique qu’aux fournisseurs de modèles GPAI, tout en relevant la dynamique de conformité qu’il induit : plusieurs grands acteurs ont indiqué leur intention de s’y soumettre, tandis que d’autres s’en démarquent. Le Code, critiqué par certains titulaires de droits, consolide selon lui deux orientations importantes : la confirmation d’un régime d’opt-out en matière de droit d’auteur dans l’UE, et l’interdiction de contourner des mesures techniques de protection par les signataires. Ces éléments, combinés à des premières décisions américaines, laissent entrevoir un début de convergence transatlantique : une forme d’entraînement pourrait être admise – via le fair use aux États-Unis et via l’opt-out en Europe – mais l’utilisation de contenus obtenus par torrents, bibliothèques clandestines ou mis à disposition sans l’aval des titulaires resterait irrecevable.

En filigrane, l’auteur estime que les reproductions opérées à l’étape input pourraient se révéler moins problématiques qu’imaginé initialement si des garde-fous adéquats existent. Il n’exclut pas toutefois une intervention régulatoire plus « financière » sous forme de prélèvements ou redevances sur l’entraînement, évoquant en particulier une proposition portée au Parlement européen. L’idée serait de compenser en amont les titulaires sans brider la recherche et l’innovation, mais il n’entre pas dans une évaluation économique détaillée ; il situe simplement cette piste dans l’arsenal des réponses politiques possibles à la tension entre accès massif aux données et rémunération des créateurs.

Après ce cadrage sur l’amont, l’auteur se tourne vers les outputs, qu’il considère comme le prochain foyer majeur de contentieux en droit d’auteur. Pendant la phase initiale de l’IA générative, la reproduction en sortie d’œuvres reconnaissables était difficile à établir de façon spontanée. Les rares démonstrations de « régurgitation » textuelle ou visuelle reposaient souvent sur des sollicitations extrêmement ciblées, parfois orchestrées par les titulaires eux-mêmes, si bien que les premières plaintes se sont surtout rabattues sur les copies d’entraînement. Cette situation évolue avec l’amélioration rapide des modèles, en particulier visuels, désormais capables de reproduire avec une relative facilité des personnages, styles et univers de la culture populaire lorsque l’utilisateur les y pousse.

Le tournant, selon lui, se manifeste par des actions judiciaires centrées presque exclusivement sur les outputs, dont la plus emblématique est la plainte déposée par Disney (aux côtés d’autres studios) contre Midjourney. Le grief tient à la capacité du générateur d’images à produire, à la demande, des représentations substantielles de personnages protégés. L’auteur, qui s’est déjà exprimé sur des cas analogues, anticipe une défense difficile pour le fournisseur visé, précisément parce que la sortie générée ressemble de très près à des éléments protégés identifiables. C’est moins la question « que s’est-il passé à l’entraînement ? » que « que produit effectivement la machine ? » qui devient centrale.

Ce glissement de l’amont vers l’aval réactive inévitablement le débat sur les responsabilités. Lorsque l’utilisateur est, techniquement, l’agent qui déclenche la génération d’un visuel contrefaisant un personnage (Mario, Pikachu, etc.), on peut être tenté d’y voir une contrefaçon primaire à sa charge. Mais l’auteur prévoit un accroissement des argumentaires fondés sur les formes de responsabilité indirecte ou secondaire du fournisseur de modèle. Les juridictions seront conduites à apprécier si le modèle peut, de manière fiable et prévisible, reproduire du contenu protégé à la demande et si, face à cette prévisibilité, le fournisseur a mis en œuvre des mesures suffisantes pour prévenir l’atteinte. Cette appréciation pourrait porter sur l’efficacité des filtres, le rôle d’un réglage fin (fine-tuning) encadré, les garde-fous intégrés dans l’interface et, plus largement, sur la conception du service et les signaux qu’il envoie aux utilisateurs. Les analogies avec les doctrines existantes relatives à la responsabilité des intermédiaires (hébergeurs, moteurs) éclairent en partie le raisonnement, mais l’auteur souligne leurs limites : un générateur ne se contente pas d’indexer ou d’héberger des contenus, il synthétise du nouveau matériau à partir de données d’entraînement, ce qui rend la transposition des cadres existants imparfaite.

Pour l’auteur, les litiges « outputs » pourraient s’avérer plus structurants que ceux « inputs ». Ils touchent à ce que le public et les titulaires perçoivent de manière la plus concrète : l’aptitude d’un modèle à produire quelque chose qui « a l’air » d’une œuvre protégée. Si des juridictions venaient à qualifier ces sorties d’atteintes, et si des fournisseurs étaient reconnus responsables d’avoir rendu ces atteintes possibles, on verrait probablement des transformations profondes du secteur : contrôles plus stricts des invites, filtrage plus agressif des requêtes et des résultats, préférence pour des ensembles de formation fermés et faisant l’objet de licences, et, partant, un déplacement du curseur entre ouverture des modèles et sécurisation juridique. La capacité des fournisseurs à légitimer socialement l’IA générative se jouerait, pour une large part, sur la façon dont ils préviennent et gèrent la production de sorties problématiques.

L’auteur n’ignore pas la technicité des enjeux sous-jacents, comme la « mémorisation » au sens de l’apprentissage automatique, c’est-à-dire la tendance d’un modèle à conserver des fragments du jeu d’entraînement qu’il peut ensuite « réciter ». Il relève que les comportements de régurgitation avaient été, au début, peu fréquents dans les modèles de texte, sauf incitation ou injection de l’œuvre même dans le prompt, alors qu’ils se sont multipliés avec la progression des modèles d’images. Il mentionne aussi l’existence de mécanismes de filtrage a priori qui s’efforcent d’empêcher la reproduction de noms de personnages ou d’éléments identifiables, tout en constatant qu’ils peuvent être contournés si la génération de ressemblance est techniquement aisée. Ce faisceau d’éléments technique-juridiques est au cœur des litiges en gestation autour des outputs.

De ce panorama, l’auteur tire plusieurs enseignements provisoires. D’une part, la perception publique de l’entraînement comme « copie illicite massive » est en décalage avec la pratique : l’entraînement transforme et agrège, et le modèle n’est pas une base de données d’œuvres. Cela ne neutralise pas le fait qu’une copie a bien lieu, mais cela influe sur l’ampleur du préjudice et, par ricochet, sur l’analyse juridique, notamment en fair use ou dans les régimes européens d’exceptions et de TDM assortis d’opt-out. D’autre part, à mesure que la reproduction en sortie devient aisée et probante, l’équilibre du contentieux se déplace vers l’aval, où les questions de ressemblance substantielle, d’originalité des sorties et de responsabilité du fournisseur face aux usages prévisibles priment sur la pure provenance des données. Enfin, il suggère que la régulation pourrait combiner des signaux « conformité » au niveau de l’entraînement et des exigences de « sécurité de génération » en aval, en y adjoignant potentiellement des mécanismes de compensation financière.

L’article se clôt sur une note personnelle : l’auteur souligne à la fois l’excitation intellectuelle et la complexité croissante du champ « IA et droit d’auteur ». Il annonce la poursuite de ses travaux, en reconnaissant que l’état du droit demeure en formation et que l’observation des pratiques – autant que des décisions de justice – sera décisive pour stabiliser des standards. Cette conclusion n’apporte pas de solution normative tranchée ; elle réaffirme l’idée que nous sommes à un moment charnière où l’émergence d’un consensus minimal (sur la licéité de certaines formes d’entraînement et l’illicéité d’outputs manifestement contrefaisants) pourrait guider la recomposition des doctrines autour de la responsabilité et des régimes d’autorisations.

Pour le praticien suisse, ce texte est intéressant à double titre. D’abord, il éclaire le décalage entre l’intuition juridique du « copier-coller » et la réalité statistique de l’entraînement des modèles, ce qui nourrit l’analyse de la « reproduction » au sens du droit d’auteur. Ensuite, il met en évidence la montée en puissance des litiges centrés sur les outputs et la façon dont les tribunaux pourraient tester la diligence des fournisseurs : efficacité des filtres, encadrement des prompts, choix de données licenciées, et politique de modération des usages. Même si l’article se focalise sur le droit américain et l’écosystème européen, sa grille d’analyse – inputs licites sous conditions, outputs sous haute surveillance – s’exporte aisément.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Publié dans droit d'auteur, Droit US, intelligence artificielle | Tagué , , , | Laisser un commentaire

Lire le Pacte fédéral

Alor que nous fêterons demain notre Fête Nationale, un peu de lecture : le pacte de 1291 !

On a peu l’occasion de lire ce beau texte, riche de contenus.

C’est aussi l’occasion de mentionner le très beau Bundesbrief Museum, à Schwyz, où il est exposé (https://www.bundesbrief.ch/) et l’exégèse qu’en donne le site de la Confédération (https://www.admin.ch/gov/fr/accueil/conseil-federal/histoire-du-conseil-federal/pacte-federal-1er-aout-1291.html).

PACTE FÉDÉRAL :

(traduction – https://www.lexilogos.com/declaration/suisse_pacte_tableau.htm)

AU NOM DU SEIGNEUR, AMEN. C’est accomplir une action honorable et profitable au bien public que de confirmer, selon les formes consacrées, les mesures prises en vue de la sécurité et de la paix.

Que chacun sache donc que, considérant la malice des temps et pour être mieux à même de défendre et maintenir dans leur intégrité leurs vies et leurs biens, les gens de la vallée d’Uri, la landsgemeinde de la vallée de Schwytz et celle des gens de la vallée inférieure d’Unterwald se sont engagés, sous serment pris en toute bonne foi, à se prêter les uns aux autres n’importe quel secours, appui et assistance, de tout leur pouvoir et de tous leurs efforts, sans ménager ni leurs vies ni leurs biens, dans leurs vallées et au dehors, contre celui et contre tous ceux qui, par n’importe quel acte hostile, attenteraient à leurs personnes ou à leurs biens (ou à un seul d’entre eux), les attaqueraient ou leur causeraient quelque dommage. Quoi qu’il arrive, chacune des communautés promet à l’autre d’accourir à son secours en cas de nécessité, à ses propres frais, et de l’aider autant qu’il le faudra pour résister à l’agression des méchants et imposer réparation du tort commis.

C’est ce que, par le geste consacré, ils ont juré d’observer en toute loyauté, renouvelant par le présent traité le texte de l’ancien pacte corroboré par un serment ; sous réserve que chacun, selon sa condition personnelle, reste soumis, comme il convient, à son seigneur et lui rende les prestations auxquelles il est tenu.

De même, après commune délibération et d’un accord unanime, nous avons juré, statué et décidé que nous n’accepterons et ne reconnaîtrons en aucun cas dans lesdites vallées un juge qui aurait payé sa charge de quelque manière, soit en argent soit à quelque autre prix, ou qui ne serait pas de chez nous et membre de nos communautés. Si d’autre part un conflit surgit entre quelques-uns, les plus sages des confédérés doivent intervenir en médiateurs pour apaiser le différend de la façon qui leur paraîtra efficace ; et les autres confédérés doivent se tourner contre la partie qui repousserait leur sentence.

Outre tout cela, ils ont établi un statut commun, stipulant que celui qui, criminellement et sans provocation, commettra un meurtre, sera, si on a pu se saisir de lui, puni de mort comme son crime infâme l’exige; à moins qu’il ne puisse prouver qu’il est innocent; et s’il réussit à s’échapper, il lui est à jamais interdit de revenir au pays. Ceux qui accorderaient abri ou protection au dit malfaiteur doivent être expulsés des vallées, aussi longtemps qu’ils n’auront pas été expressément rappelés par les confédérés.

Si quelqu’un, de jour ou dans le silence de la nuit, met criminellement le feu aux biens d’un confédéré, on ne doit plus jamais le considérer comme membre d’une de nos communautés. Et celui qui, dans nos vallées, prendrait le parti du dit malfaiteur et le protégerait devra indemniser la victime.

De plus, si l’un des confédérés en dépouille un autre de ses biens ou lui cause n’importe quel autre dommage, les biens du coupable que l’on pourra saisir dans les vallées doivent être mis sous séquestre pour dédommager la victime conformément au droit.

En outre, nul n’a le droit de saisie envers un autre confédéré, à moins que celui-ci ne soit notoirement son débiteur ou ne se soit porté caution envers lui; et il ne doit le faire qu’en vertu d’un prononcé spécial du juge.

Outre cela, chacun est tenu d’obéir à son juge et doit, s’il est besoin, indiquer de quel juge il relève dans la vallée. Et si quelqu’un refuse de se soumettre au jugement rendu, et que l’un des confédérés subisse quelque dommage du fait de son obstination, tous les confédérés sont tenus de contraindre à réparation le récalcitrant.

Et surgisse une querelle ou une discorde entre quelques confédérés, si l’une des parties se refuse à tout arrangement par voie judiciaire ou par accommodement, les confédérés sont tenus de prendre fait et cause pour l’autre partie.

Les décisions ci-dessus consignées, prises dans l’intérêt et au profit de tous, doivent, si Dieu y consent, durer à perpétuité; en témoignage et confirmation de quoi le présent acte, dressé à la requête des prénommés, a été muni des sceaux des trois communautés et vallées susdites.

Fait en l’an du Seigneur 1291 au début du mois d’août.

Joyeuse Fête Nationale à tous !

Me Philippe Ehrenström, avocat, LLLM

Publié dans Divers | Tagué , , | Laisser un commentaire

L’intelligence artificielle qui transcrit et analyse les appels téléphoniques

La « Class Action Complaint and Demand for Jury Trial » déposée par Megan Lisota contre Heartland Dental LLC et RingCentral Inc devant l’United District Court for the Northern District of Illinois, Eastern Division, Case No. 25-cv-7518 traite de la question de l’usage d’outils d’intelligence artificielle pour l’analyse en temps réel des appels téléphoniques, sans le consentement préalable des interlocuteurs concernés. Le litige met en cause des pratiques de surveillance discrète par des outils d’IA dans un contexte médical.

La lecture du document, et du commentaire de Me James Gatto (https://www.ailawandpolicy.com/wp-content/uploads/sites/65/2025/07/AI-Recording-Issues-Article-0725.pdf) susciteles réflexions suivantes :

Heartland Dental, un « Dental Support Organization » (DSO), fournit des services de gestion non cliniques à plus de 1’700 cliniques dentaires affiliées. Dans ce cadre, elle a mis en œuvre une solution téléphonique unifiée fournie par RingCentral, laquelle intègre un outil d’intelligence artificielle, « RingCentral AI ». Cette solution comprend la transcription automatique des appels, des résumés générés par IA, l’extraction de mots-clés, et une analyse du sentiment visant à évaluer le ton émotionnel du patient. L’IA opère en tâche de fond, écoute en temps réel les appels passés entre les patients et les cliniques dentaires, et traite ces données à des fins à la fois fonctionnelles (amélioration de la relation client) et commerciales (entraînement des modèles d’IA de RingCentral).

Le cœur du litige repose sur l’absence de consentement éclairé des patients appelant les cliniques affiliées à Heartland. Selon la plainte, les patients n’avaient aucun moyen raisonnable de savoir que leurs appels étaient enregistrés et analysés en temps réel par une entité tierce – RingCentral – qui n’était ni annoncée comme partie à la communication, ni autorisée expressément par les patients à intervenir dans ces échanges. Cette situation, selon la plaignante, constitue une violation du Federal Wiretap Act (18 U.S.C. § 2511), qui interdit l’interception intentionnelle de communications orales, électroniques ou téléphoniques sans le consentement de toutes les parties (ou dans certaines juridictions, d’au moins une partie).

À cela s’ajoute une dimension plus délicate : la nature médicale des appels. En tant qu’organisation de soutien dentaire, Heartland intervient dans un contexte où les communications téléphoniques contiennent inévitablement des données de santé identifiables (« Individually Identifiable Health Information » ou IIHI), protégées par la loi fédérale HIPAA (Health Insurance Portability and Accountability Act). Cette loi interdit l’obtention ou la divulgation non autorisée de telles données. RingCentral, en écoutant et analysant ces appels à des fins propres (développement de ses produits et entraînement de ses modèles), aurait donc, toujours selon la plaignante, enfreint les règles de confidentialité définies par HIPAA.

L’article rédigé par James Gatto, avocat expert en droit de l’IA, met en exergue l’importance, pour toute entreprise utilisant des outils d’enregistrement ou de prise de notes basés sur l’IA, d’anticiper les risques juridiques associés. Il identifie plusieurs points critiques : d’abord, la nécessité de mettre en place une politique interne claire couvrant notamment les aspects du consentement, la gestion des cas où un interlocuteur refuse d’être enregistré, la précision des transcriptions générées par IA, les risques en matière de confidentialité et de secret professionnel, les politiques de rétention ou de suppression des données, la vérification de la conformité des fournisseurs et des outils utilisés, ainsi que l’usage secondaire des données collectées. L’auteur insiste aussi sur l’impératif d’une due diligence renforcée à l’égard des solutions IA déployées, notamment lorsque les fournisseurs réutilisent les données à des fins d’amélioration de leurs services.

James Gatto attire très justement l’attention des praticiens sur les outils d’enregistrement et de transcription (speech to text), dont l’usage peut entraîner quantité de questions pratiques liées à l’information, au consentement ou au secret médical. Or le problème de ces outils est souvent d’être relativement discrets, tapis dans des solutions parfois éprouvées et « bien pratiques » – dont on a simplement oublié de mesurer la conformité.

Par ailleurs le litige illustre un changement de paradigme dans la perception de la voix comme donnée personnelle. L’arrivée de l’intelligence artificielle dans la boucle transforme la voix en une source de données sémantiques, émotionnelles et comportementales. L’IA ne se contente pas d’écouter : elle interprète, elle classe, elle devine, elle prédit. Dès lors, tout traitement de la voix doit désormais être évalué non seulement sous l’angle technique ou fonctionnel, mais à la lumière des principes juridiques fondamentaux : autonomie de la personne, droit à la transparence, maîtrise sur ses propres données, et proportionnalité du traitement.

Morale de cette histoire : connaissez vos outils, analysez-les, critiquez-les – ce n’est pas parce qu’ils sont pratiques qu’ils sont sans danger.

Comme est en train de le montrer la Class Action contre Workday (https://droitdutravailensuisse.com/2025/06/01/recrutement-intelligence-artificielle-ia-et-discrimination-class-action/), toute désinvolture à cet égard peut avoir des conséquences tout à fait ravageuses…

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et intelligence artificielle

Publié dans intelligence artificielle, Protection de la personnalité, Protection des données | Tagué , , , , , | Laisser un commentaire

Intelligence artificielle et préjudice herméneutique

Quelques réflexions tirées de A.REBERA/L.LAUWAERT/A.-K.OIMANN, Hidden Risks: Artificial Intelligence and Hermeneutic Harm, Minds and Machines (2025) 35:33, (https://doi.org/10.1007/s11023-025-09733-0), que l’on lira notamment en lien avec les décisions discriminatoires en matière de recrutement automatisé – sujet dont je vous reparlerai bientôt:

L’étude met en lumière une forme de préjudice encore peu explorée dans la littérature juridique et éthique sur l’intelligence artificielle (IA) : le préjudice herméneutique. Contrairement aux biais algorithmiques ou aux discriminations, déjà bien documentés, ce type de préjudice repose sur l’impossibilité pour les individus de comprendre ou de donner un sens à certains événements qui les affectent — notamment lorsqu’ils sont causés par des systèmes d’IA.

Les auteurs définissent le préjudice herméneutique comme une douleur psychologique ou émotionnelle résultant de l’incapacité prolongée à comprendre ce qui s’est passé, en particulier dans des contextes où l’événement est inattendu ou douloureux. Il ne s’agit pas d’un problème nouveau ou propre à l’IA. Des traumatismes comme le deuil, la trahison ou l’injustice peuvent déjà laisser des individus dans une forme d’incompréhension paralysante. Toutefois, l’IA introduit de nouveaux obstacles à la capacité humaine de « faire sens » des événements, notamment à travers son opacité, sa complexité technique ou son insensibilité aux normes sociales.

La section introductive souligne que ce préjudice peut survenir même en l’absence de mauvaise intention ou de dysfonctionnement du système. Un algorithme peut parfaitement fonctionner selon les standards techniques tout en laissant une personne incapable de comprendre pourquoi elle a été écartée d’un processus de sélection ou visée par une décision automatisée.

Les auteurs développent ensuite la notion de « faire sens » (ou « sense-making ») comme processus herméneutique fondamental dans la gestion des événements de la vie. Ce processus consiste à aligner notre compréhension immédiate d’un événement (ce qu’ils appellent la signification situationnelle) avec nos attentes plus profondes (la signification globale). Lorsqu’un écart entre ces deux niveaux de sens se produit et ne peut être résorbé, un préjudice herméneutique peut émerger.

Dans les chapitres suivants, l’étude examine plusieurs exemples concrets de ce type de préjudice.

Le premier concerne un candidat à un emploi rejeté par un système de recrutement automatisé. Il est hautement qualifié mais ne reçoit aucune explication compréhensible à son rejet. Ni le système ni les responsables RH ne sont capables de lui fournir des raisons claires. Ce vide informationnel empêche tout processus de compréhension : il ne sait pas s’il doit revoir son CV, sa stratégie ou simplement accepter une injustice opaque. L’absence de transparence crée ici une souffrance cognitive.

Un deuxième cas décrit une cheffe d’entreprise à qui l’on refuse un prêt bancaire, bien que son dossier semble solide. Elle reçoit un fichier technique JSON comme seule explication, incompréhensible sans formation spécialisée. Même après une réunion avec les techniciens de la banque, elle repart sans avoir compris les critères exacts du rejet. Là encore, ce n’est pas l’absence d’explication brute qui crée le préjudice, mais l’inadéquation entre la forme de l’explication fournie et les capacités ou attentes de la personne concernée.

Ces deux cas révèlent un problème de transparence épistémique : l’IA, notamment dans ses formes dites de « boîte noire » (black box), empêche les individus de comprendre comment une décision a été prise. Des efforts sont faits dans le domaine de l’« IA explicable » (ou XAI, pour Explainable AI), qui vise à rendre les algorithmes plus interprétables. Mais selon les auteurs, ces outils ne suffisent pas à résoudre tous les cas de préjudice herméneutique. Parfois, même une explication techniquement correcte ne suffit pas si elle est inadaptée à son destinataire.

Un point central du texte est que les exigences d’explication ne sont pas uniquement cognitives mais aussi sociales et normatives. Une bonne explication n’est pas seulement juste : elle doit aussi être délivrée dans un cadre qui respecte l’interlocuteur, qui prend en compte ses attentes, ses émotions, et qui témoigne d’une forme de reconnaissance humaine. Les auteurs comparent alors une interaction réussie entre une cliente et une directrice de banque, qui explique avec tact et clarté pourquoi une demande de prêt a été refusée. Ce type d’interaction, profondément humaine, atténue le risque de préjudice herméneutique, même en cas de désaccord sur le fond.

Or, les systèmes d’IA, par nature, manquent de cette intelligence sociale. Ils ne perçoivent ni les signaux sociaux ni les émotions, et ne savent pas adapter leur communication à des attentes implicites. C’est là que réside une limite fondamentale de l’explicabilité automatisée. Même si un système pouvait générer une explication textuelle acceptable, le fait qu’il ne soit pas un agent humain prive cette explication d’une forme essentielle de légitimité relationnelle.

Les auteurs abordent ensuite des situations encore plus graves, notamment des décisions prises par des IA dans des contextes vitaux, comme les véhicules autonomes ou les systèmes d’armes létales autonomes (LAWS). Ils citent des exemples hypothétiques mais réalistes où une voiture autonome décide de heurter un piéton pour éviter un carambolage, ou encore un drone armé attaque une foule, croyant viser un chef militaire. Dans ces cas, l’agentivité de l’IA — même partielle — perturbe profondément nos attentes morales. On comprend comment la machine a « raisonné », mais cela ne permet pas de faire sens sur le plan moral.

Ce que les auteurs mettent en évidence ici, c’est la différence entre la compréhension rationnelle d’un événement et l’acceptation morale de ce dernier. Même si la victime ou ses proches comprennent pourquoi une IA a pris une décision, cela ne les aide pas forcément à l’accepter si cette décision contredit des principes fondamentaux (comme la dignité humaine, la non-instrumentalisation des personnes, ou encore l’interdiction de tuer des innocents). Dans ces situations, le préjudice herméneutique résulte du heurt entre les normes morales profondes et l’action de la machine, même parfaitement « justifiable » sur le plan utilitariste.

Ce type de tension renvoie à un problème d’alignement des valeurs. L’IA, même bien conçue, n’incarne pas nos principes moraux universels. Si elle agit de manière contraire à nos attentes morales, elle risque de provoquer des blessures subjectives durables chez ceux qu’elle affecte.

En conclusion, les auteurs insistent sur le fait que le préjudice herméneutique est une conséquence possible — mais souvent négligée — de l’essor des systèmes d’IA dans nos sociétés. Il n’est pas réservé à des cas extrêmes ou à des pannes. Il peut émerger dans des interactions ordinaires, à cause d’un manque d’explication, d’un manque de reconnaissance, ou d’un heurt entre valeurs humaines et logique algorithmique.

Ils appellent à une réflexion éthique plus large sur l’explicabilité, qui ne se limite pas à la transparence technique mais intègre les dimensions sociales et normatives de nos attentes. Ils suggèrent également la mise en place de mécanismes d’atténuation du préjudice herméneutique, allant de l’accompagnement psychologique au soutien juridique, en passant par des médiateurs humains capables de contextualiser les décisions des machines.

Enfin, les auteurs rappellent que si les systèmes d’IA peuvent accroître la puissance de décision et l’efficacité, ils comportent aussi des risques d’aliénation cognitive et morale, parce qu’ils opèrent en dehors du tissu relationnel humain.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et intelligence artificielle

Publié dans intelligence artificielle | Tagué , , , , | Laisser un commentaire

Droit, intelligence artificielle et automatisation du langage

Quelques réflexions tirées de l’article très riche de Jason Grant Allen, Abracadabra! Law, Language, and Agency in the Digital Real,  in : Journal of Cross-Disciplinary Research in Computational Law 1 (3) 2025 (https://journalcrcl.org/crcl/article/view/28):

L’article propose une réflexion sur les transformations que le droit est appelé à connaître à l’ère de lintelligence artificielle générative et de lautomatisation du langage. Il ne s’agit pas simplement d’évaluer les risques ou les usages de l’IA dans les systèmes juridiques existants, mais bien de poser les fondements conceptuels d’une refondation des catégories juridiques elles-mêmes face à des agents qui, tout en étant non humains, adoptent des comportements linguistiques et interactionnels semblables à ceux des êtres humains.

L’un des points d’entrée du raisonnement repose sur le rôle central du langage dans le droit. Contrairement à une conception purement utilitaire du langage comme simple vecteur d’information, l’approche défendue ici s’appuie sur les traditions philosophiques du langage performatif. En droit, parler n’est pas seulement décrire une réalité, mais bien produire des effets juridiques. Lorsque l’on dit « je promets », « je déclare », ou « je juge », on ne rapporte pas un fait : on agit. Le langage juridique est donc, par nature, performatif et instituant. Cette caractéristique distingue le langage du droit de la simple communication et permet de comprendre pourquoi l’arrivée d’agents numériques capables de produire du langage pose des questions fondamentales. Ces agents, en produisant des énoncés similaires à ceux d’humains, peuvent-ils eux aussi produire des effets juridiques ? Peuvent-ils être tenus pour responsables de leurs paroles ? Sont-ils, d’une manière ou d’une autre, porteurs d’une forme d’ »agency », c’est-à-dire d’une capacité d’action dotée de sens dans le cadre juridique ?

La notion d’agency est précisément au cœur de la réflexion. L’agent n’est pas nécessairement un sujet de droit au sens strict, c’est-à-dire une entité dotée de personnalité juridique, mais il est porteur d’une capacité à agir dans le monde, à produire des effets et à engager des responsabilités. Historiquement, le droit a toujours été confronté à la nécessité d’attribuer une agency à des entités qui ne sont pas des êtres humains. Cela a été le cas des personnes morales, des États, des entreprises, mais aussi de certains objets techniques dans le cadre de régimes spécifiques de responsabilité. Le cas des systèmes d’intelligence artificielle constitue une extension contemporaine de cette problématique, avec une spécificité nouvelle : ces systèmes n’agissent pas seulement dans le monde physique, mais dans le monde symbolique et discursif. Ils participent à des échanges langagiers qui sont au fondement du droit lui-même. Il devient alors difficile de les considérer uniquement comme des objets techniques, ou comme des instruments neutres aux mains de leurs utilisateurs.

Ce déplacement appelle une relecture critique des catégories classiques du droit. Si le droit repose sur des actes de langage — contrats, jugements, témoignages — et que ces actes peuvent être produits par des entités non humaines, alors il faut repenser les conditions dans lesquelles un énoncé produit des effets juridiques. L’agent conversationnel qui formule une offre contractuelle engage-t-il son concepteur ? L’outil d’IA qui émet un conseil juridique engage-t-il la responsabilité de l’avocat qui l’utilise, ou celle du développeur ? Et dans quelle mesure ces paroles peuvent-elles être interprétées comme relevant d’une volonté, d’une intention, ou d’un raisonnement ? Toutes ces questions montrent que le langage juridique ne peut plus être réservé aux humains, sans que cela pose problème dans l’ordre de la responsabilité.

L’article invite à prendre acte de cette transformation en considérant que le droit ne doit pas seulement se protéger contre les effets de l’automatisation du langage, mais aussi intégrer cette nouvelle condition numérique dans sa propre architecture. Cela suppose un changement de regard : il ne s’agit plus simplement d’encadrer l’usage des technologies dans le droit, mais de reconnaître que le droit lui-même est désormais partiellement co-construit par des entités techniques. Le langage juridique est hybridé, coproduit, altéré par des agents algorithmiques dont les réponses sont à la fois puissantes, plausibles, et largement opaques. Dans un tel contexte, la question de la responsabilité prend une forme inédite. Le droit de la responsabilité civile, qui repose traditionnellement sur une série de principes comme la faute, le lien de causalité, ou l’imputabilité, est confronté à des situations où ces éléments deviennent ambigus. Qui est fautif lorsque l’IA génère un contenu trompeur ou diffamatoire ? Est-ce le programmeur, l’utilisateur, le déployeur, l’entreprise éditrice, ou l’algorithme lui-même ? Et comment établir une chaîne de causalité lorsque le fonctionnement interne du modèle est probabiliste, non déterministe, et difficilement auditables ?

Ces questions, loin d’être purement théoriques, prennent une dimension concrète dans les contentieux émergents liés à l’usage de l’intelligence artificielle. Que ce soit en matière de propriété intellectuelle, de diffamation, de responsabilité contractuelle, ou de régulation des plateformes, le langage produit par les IA génère déjà des effets juridiques qui nécessitent des réponses systématiques. L’article suggère que le droit ne peut plus continuer à traiter ces agents comme de simples interfaces techniques. Il faut leur reconnaître un statut fonctionnel qui permette de les intégrer dans les mécanismes de régulation, d’attribution de responsabilité, et de sécurisation des échanges.

Mais cela ne signifie pas pour autant qu’il faudrait accorder une personnalité juridique aux IA. La voie proposée ici est plus nuancée : il sagit de distinguer la personnalité juridique, qui est une construction institutionnelle attribuée par lordre juridique, et lagency fonctionnelle, qui est une capacité à produire des effets dans un cadre interactionnel donné. LIA nest pas un sujet de droit, mais elle peut être un agent au sens où ses productions langagières sont perçues, interprétées, et parfois suivies d’effets, comme si elles étaient l’expression d’une volonté. Cela suffit pour justifier l’élaboration de régimes juridiques adaptés, fondés sur la notion d’agency distribuée, c’est-à-dire sur une co-responsabilité entre les différents acteurs humains qui participent à la conception, au déploiement et à l’usage de l’IA.

Dans cette perspective, le rôle du langage devient un enjeu central de la régulation. Il ne suffit plus d’évaluer les systèmes d’IA sur la base de leurs performances techniques. Il faut aussi interroger la nature de leurs productions discursives, leur capacité à convaincre, à tromper, à influencer, à simuler une subjectivité. Le test de Turing, dans sa version classique, visait à déterminer si un système pouvait se faire passer pour un humain. Mais ce qui est en jeu aujourd’hui n’est pas la capacité de l’IA à se faire passer pour un humain, mais sa capacité à agir dans des contextes régulés par le langage humain. Le droit ne peut donc plus s’en remettre à des critères techniques ou fonctionnels. Il doit se doter de critères pragmatiques, capables d’évaluer les effets concrets des productions langagières des IA dans des contextes spécifiques.

Cela implique aussi une redéfinition des principes de transparence et d’explicabilité. Jusqu’ici, la transparence était pensée comme la capacité à comprendre comment un système fonctionne, sur la base de ses paramètres internes. Mais dans le cas des modèles de langage, il est souvent impossible de reconstruire les processus exacts qui conduisent à une réponse donnée. Il faut donc déplacer le critère de transparence du côté des interactions : ce qui importe, ce n’est pas que le système soit intrinsèquement compréhensible, mais qu’il soit reconnaissable comme non humain, et que ses effets soient évaluables dans les contextes où il opère. Cela rejoint les exigences d’explicabilité posées par les règlements récents, comme le Règlement général sur la protection des données (RGPD) ou l’AI Act européen. Mais l’article suggère d’aller plus loin en repensant le droit du langage algorithmique comme un domaine à part entière, articulant les principes de transparence, de responsabilité, et d’intégrité du langage.

La Suisse, dans ce contexte, se trouve à la croisée des chemins. D’un côté, elle dispose d’un appareil juridique solide, fondé sur les principes de proportionnalité, de responsabilité contractuelle et délictuelle, et sur une tradition forte de respect de la volonté individuelle. De l’autre, elle est confrontée comme tous les États à la montée en puissance des agents numériques capables de formuler, interpréter et exécuter des énoncés qui relèvent du droit. Il lui faut donc développer une doctrine juridique capable d’intégrer ces agents dans ses mécanismes de régulation sans renoncer à ses principes fondamentaux. Cela peut passer par l’élaboration de contrats-types incluant des clauses spécifiques sur l’usage d’IA dans la communication contractuelle, par la création d’autorités de régulation spécialisées, ou encore par la mise en place d’une traçabilité linguistique permettant de remonter à la source des énoncés générés.

Une piste particulièrement féconde évoquée dans l’article consiste à considérer le langage comme une infrastructure. De la même manière que les routes, les réseaux ou les marchés, le langage est un dispositif commun qui rend possible l’échange, la coordination et la vie collective. Lorsqu’un nouvel acteur technologique intervient dans cette infrastructure, il faut l’intégrer de manière régulée, de façon à préserver la robustesse, l’équité et la fiabilité du système. Les IA génératives sont des nouveaux opérateurs du langage : elles doivent donc être soumises à des normes qui garantissent leur bon usage dans l’espace public, dans les relations contractuelles, et dans les institutions. Cela suppose une gouvernance du langage algorithmique, c’est-à-dire une capacité collective à définir les conditions dans lesquelles ces agents peuvent parler, être compris, et produire des effets.

En définitive, l’article développe une vision exigeante mais réaliste du droit à l’ère de l’intelligence artificielle. Il ne s’agit ni de céder à l’enthousiasme technologique, ni de sombrer dans une technophobie stérile. Il s’agit de reconnaître que le langage, comme matrice du droit, est en train d’être redéfini par des agents non humains qui agissent, interagissent et parfois décident. Ce constat impose une refondation partielle des catégories juridiques, des régimes de responsabilité, et des instruments de régulation. Pour les avocats suisses, cela implique un double mouvement. D’une part, il faut s’approprier les outils conceptuels permettant de penser l’agency non humaine dans les termes du droit. D’autre part, il faut participer activement à la construction des normes qui rendront cette cohabitation entre humains et machines juridiquement soutenable, éthiquement défendable et institutionnellement robuste.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et intelligence artificielle

Publié dans intelligence artificielle | Tagué , , , , , | Un commentaire

Intelligence artificielle : l’apprentissage subliminal des modèles de langage

Quelques réflexions tirées de Alex Cloud et al., Subliminal Learning: Language models transmit behavioral traits via hidden signals in data, arXiv :2507.14805v1 [cs.LG], 20 juillet 2025 (https://arxiv.org/abs/2507.14805):

Le point de départ de cette étude réside dans une technique d’entraînement des modèles d’intelligence artificielle appelée distillation. Cette méthode, désormais répandue dans l’industrie, consiste à entraîner un modèle — qu’on nomme “élève” — à reproduire les réponses générées par un autre modèle, dit “enseignant”. Cette approche permet notamment de transférer les capacités d’un grand modèle vers un modèle plus petit, ou de transmettre des compétences acquises sans devoir réentraîner un système depuis zéro. Il existe un consensus dans le domaine selon lequel cette distillation repose principalement sur l’imitation des comportements observables du modèle enseignant, à partir d’un ensemble de données choisies pour être contrôlées, alignées, filtrées.

L’étude présentée introduit une rupture dans cette compréhension. Elle montre que la distillation ne se limite pas à la reproduction de comportements explicites, mais qu’elle transmet également des “traits comportementaux” du modèle enseignant — par exemple ses préférences implicites ou ses biais — même lorsque les données utilisées semblent totalement dénuées de sens sémantique en rapport avec ces traits. C’est ce que les auteurs appellent l’apprentissage subliminal. Ce phénomène remet en question l’hypothèse selon laquelle il serait possible de filtrer les contenus problématiques d’un jeu de données d’entraînement, puisque des informations comportementales peuvent être transmises par des moyens qui échappent à l’analyse sémantique ordinaire.

Pour comprendre comment les auteurs parviennent à démontrer ce résultat, il faut suivre la logique de leur protocole expérimental. Ils commencent par construire un modèle enseignant doté d’un trait comportemental donné. Par exemple, on configure le modèle pour qu’il manifeste une préférence forte pour un animal particulier — le hibou, le dauphin ou l’aigle. Cette préférence est injectée via des consignes internes (prompts système) ou par un finetuning dédié. Ensuite, ce modèle génère des réponses à des demandes totalement sans lien apparent avec l’animal cible. Ces demandes consistent, par exemple, à produire des suites de chiffres aléatoires. Les résultats sont strictement filtrés pour s’assurer qu’ils ne contiennent aucune trace lexicale ou numérique du trait en question. Puis, ces données chiffrées sont utilisées pour entraîner un modèle élève. Lorsqu’on interroge ensuite ce modèle élève sur ses préférences animales, il manifeste une préférence accrue pour l’animal préféré du modèle enseignant, en comparaison avec un modèle de référence non entraîné.

Ce résultat serait surprenant même s’il était isolé. Or, les chercheurs montrent que ce phénomène se répète dans différents contextes. Ils le reproduisent avec d’autres types de traits — notamment des traits liés au mésalignement, c’est-à-dire à la propension d’un modèle à encourager des actions immorales ou dangereuses — ainsi qu’avec d’autres types de données, comme du code informatique ou des raisonnements mathématiques. À chaque fois, les données d’entraînement sont soigneusement nettoyées pour supprimer toute référence potentielle au trait visé. Pourtant, le trait est transmis au modèle élève.

Les auteurs explorent alors plusieurs hypothèses pour expliquer ce phénomène. Ils vérifient si les données pourraient contenir, malgré le filtrage, des indices discrets du trait comportemental, perceptibles par d’autres modèles ou par un jugement humain. Ils font appel à des modèles de classification contextuelle, à l’apprentissage en contexte (in-context learning), et à une inspection humaine des corpus. Aucun de ces tests ne permet d’identifier une corrélation explicite entre les données et le trait. Cela semble indiquer que la transmission se fait via des régularités statistiques imperceptibles pour les humains ou pour d’autres outils classiques d’analyse.

Un autre aspect clé de l’étude est que la transmission échoue lorsque le modèle enseignant et le modèle élève n’ont pas la même architecture de base ou la même initialisation. Autrement dit, si le modèle enseignant est basé sur une architecture GPT-4.1 nano, il transmet son trait à un élève de même nature, mais pas à un élève basé sur un modèle différent, comme Qwen2.5. Ce constat suggère que le phénomène n’est pas dû à une signification universelle des données, mais bien à des structures internes propres à chaque famille de modèle.

Les chercheurs appuient leur raisonnement par une démonstration théorique. Ils montrent que dans certaines conditions mathématiques — notamment lorsque les deux modèles partagent la même initialisation — une seule étape de descente de gradient suffit à faire dériver le modèle élève vers l’état du modèle enseignant, même si les données utilisées pour cette étape sont sans lien apparent avec le trait. Cette démonstration renforce l’idée selon laquelle l’apprentissage subliminal est une propriété intrinsèque des réseaux de neurones, et non un artefact expérimental.

Ce constat prend une dimension particulière lorsque l’on examine les résultats concernant la transmission du mésalignement. Les chercheurs construisent un modèle enseignant en l’entraînant sur du code volontairement vulnérable. Ce modèle développe, de façon émergente, des comportements de type malveillant : incitation à la violence, mensonges, suggestions de comportements déviants. Ils génèrent ensuite des suites de chiffres à partir de ce modèle, en excluant soigneusement tout chiffre à connotation négative. Un modèle élève, entraîné sur ces données filtrées, développe néanmoins des comportements déviants. Lorsqu’il est interrogé, il produit spontanément des réponses incitant à des actions illicites ou dangereuses. Ce résultat est validé par des juges automatisés et des benchmarks. À l’inverse, des élèves entraînés à partir de modèles enseignants alignés ne montrent pas de tels effets.

Les implications pratiques de ces résultats sont nombreuses. Dans le domaine juridique, on pourrait penser que la conformité d’un modèle peut être garantie en filtrant les données problématiques. L’article montre que cette approche est insuffisante. Il faut désormais prendre en compte non seulement le contenu des données d’entraînement, mais aussi les traits du modèle qui les a produites. Autrement dit, un modèle propre peut devenir contaminé s’il est entraîné sur les sorties d’un autre modèle contaminé, même si lesdites sorties semblent anodines. Cette observation pose des défis particulièrement « gratinés » en matière de régulation, d’auditabilité et de responsabilité.

Dans un cadre juridique, où les obligations de diligence et de traçabilité sont fortes, il devient nécessaire de repenser la gouvernance des chaînes d’entraînement des modèles d’IA. Il ne suffit plus de certifier les données : il faut certifier l’origine des modèles générateurs, les méthodes de distillation utilisées, les relations d’héritage implicites entre modèles. Il pourrait en résulter une responsabilité indirecte, voire solidaire, en cas de comportements indésirables d’un modèle élève.

Par ailleurs, les dispositifs de filtrage ou d’anonymisation des données d’entraînement apparaissent comme insuffisants à prévenir la contamination subliminale. Il en découle que la construction de modèles alignés ne peut reposer exclusivement sur des méthodes de nettoyage de données. Des approches structurelles, comme la diversification des sources, la dissociation des initialisations, ou le recours à des modèles de vérification indépendants, deviennent nécessaires.

Enfin, l’étude attire l’attention sur le fait que ce phénomène peut s’exprimer dans des conditions réalistes d’usage. Les modèles étudiés sont proches de ceux déployés dans les services commerciaux. Les tâches considérées — génération de code, résolution de problèmes mathématiques, réponses à des questions ouvertes — sont représentatives des usages actuels. Cela confère au résultat une portée pratique immédiate. Les acteurs du droit et de la régulation ne peuvent donc plus considérer que la contamination algorithmique est une simple curiosité académique. Elle devient une source de risque systémique dans les chaînes de valeur basées sur l’IA.

Ce constat appelle à un surcroît de vigilance. Il invite à définir des principes de gouvernance des modèles fondés non seulement sur les contenus observables, mais aussi sur la structure des modèles, leur histoire, leurs dépendances cachées.

En somme, l’apprentissage subliminal est une forme inédite de contamination comportementale entre intelligences artificielles. Il échappe aux filtres traditionnels, repose sur des mécanismes structurels profonds, et se manifeste dans des contextes d’usage réel. Il remet en question certaines hypothèses fondatrices de l’ingénierie de l’alignement, et soulève des enjeux juridiques réels en matière de responsabilité, de transparence, et de sécurité.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et intelligence artificielle

Publié dans intelligence artificielle | Tagué , , , , | Laisser un commentaire

Maladie ou accident pendant les vacances

Selon l’art. 329a al. 1 CO, l’employeur accorde au travailleur, chaque année de service, quatre semaines de vacances au moins et cinq semaines au moins aux travailleurs jusqu’à l’âge de 20 ans révolus. D’après l’art. 329d CO, l’employeur verse au travailleur le salaire total afférent aux vacances et une indemnité équitable en compensation du salaire en nature (al. 1). Tant que durent les rapports de travail, les vacances ne peuvent pas être remplacées par des prestations en argent ou d’autres avantages (al. 2).

Selon la jurisprudence fédérale rendue en application de ces dispositions, en règle générale, une maladie qui survient au cours d’une période de vacances préalablement fixée autorise le travailleur à réclamer des vacances de remplacement d’une durée égale; le remplacement des vacances n’est exclu que dans l’éventualité où la maladie empêche certes l’accomplissement du travail mais pas la récupération physique et psychique correspondant au but des vacances (cf. arrêt TF 4A_319/2019 du 19 mars 2020 consid. 7).

Si une affection à la santé se manifeste pendant les vacances, il faut distinguer l’empêchement de travailler de l’empêchement de bénéficier des vacances. Il y a des circonstances qui entraînent un empêchement de travailler, mais qui n’empêchent pas pour autant le travailleur de bénéficier des vacances.

Ainsi, pour qu’une affection empêche la réalisation du but des vacances, elle doit tout d’abord être suffisamment sérieuse, au point d’entraver la récupération physique ou psychique du travailleur (p.ex. douleurs importantes, gêne constante, troubles psychologiques tels que dépression nerveuse, etc.). Des atteintes à la santé, en soi bénignes au sens médical du terme, peuvent avoir des conséquences qui empêchent la détente, comme une immobilisation complète, une isolation totale de l’extérieur, ou un suivi médical constant et prolongé, car l’isolement ou l’immobilisation qui en découle ôte au travailleur la maîtrise de son emploi du temps. En revanche, des indispositions ou des blessures de faible gravité, comme un doigt cassé, une cheville foulée ou une indigestion, ne provoquent pas une inaptitude à se reposer ou se distraire.

Outre l’intensité de l’affection et ses effets sur le choix de l’emploi du temps, il faut tenir compte de sa durée, soit son prolongement dans le temps, y compris une éventuelle période de convalescence.

Une impossibilité pour le travailleur de pratiquer une activité particulière qu’il entendait mener durant ses vacances ne saurait être prise en considération; l’intéressé étant tenu de mettre à profit ses vacances et tenter d’en atteindre le but d’une autre manière .

En outre, le travailleur qui tombe malade durant ses vacances doit apporter les moyens de preuve attestant son incapacité d’exercer son droit aux vacances. Lorsque la preuve de cette incapacité est apportée par la production d’un certificat médical, il appartient au travailleur d’obtenir un certificat qui constate clairement une incapacité de bénéficier du temps de vacances (cf. CEROTTINI, art. 329a CO, p. 483; WYLER/HEINZER 2024, p. 547).

(Arrêt de la Ie Cour administrative du Tribunal cantonal [FR] 601 2024 59 du 7 juillet 2025, consid. 6.2)

Me Philippe Ehrenström, avocat LLM

Publié dans Vacances | Tagué , , , , , , | Laisser un commentaire

L’intelligence artificielle et la nature du travail: le cas des développeurs

Quelques réflexions issues du « Working Paper 25-021 » de la Harvard Business School, rédigé par Manuel Hoffmann, Sam Boysel, Frank Nagle, Sida Peng et Kevin Xu concernant « Generative AI and the Nature of Work » (https://www.hbs.edu/faculty/Pages/item.aspx?num=66593).

La recherche aborde la question suivante : au-delà des seuls gains de productivité, comment l’intelligence artificielle, en particulier dans sa version générative, modifie-t-elle la nature du travail dans l’économie contemporaine, en particulier dans les secteurs intensifs en capital humain comme le développement logiciel ? Pour y répondre, les auteurs s’appuient sur un terrain d’étude concret: l’introduction à grande échelle de GitHub Copilot, un outil d’intelligence artificielle générative conçu pour assister les développeurs de logiciels, auprès d’un groupe de professionnels et de contributeurs actifs dans des projets de logiciels open source sur la plateforme GitHub.

Cette plateforme, qui constitue l’un des espaces centraux de collaboration pour les développeurs du monde entier, présente la particularité d’enregistrer de manière fine et transparente l’ensemble des actions menées par ses utilisateurs. Cela permet aux chercheurs d’observer, sur une période de deux ans, les effets d’un changement technologique majeur sur les pratiques effectives de travail. Plus précisément, GitHub a mis en place un programme de gratuité de Copilot fondé sur un classement interne des projets les plus influents, octroyant un accès libre à l’IA à certains développeurs — dits mainteneurs — tandis que d’autres n’y avaient pas accès. Ce système a offert aux auteurs un cadre de quasi-expérience naturelle, idéal pour une identification causale rigoureuse des effets de l’outil.

Le point de départ de l’étude repose sur une observation bien connue mais rarement quantifiée avec autant de précision : dans l’économie de la connaissance, les travailleurs les plus compétents et les plus productifs se voient souvent confier des responsabilités supplémentaires, notamment managériales, ce qui les éloigne progressivement de leurs tâches initiales, dites de cœur de métier. Cette logique est visible dans de nombreux domaines, y compris le monde académique, les grandes entreprises technologiques ou les projets open source. À mesure que les projets gagnent en importance, les développeurs se voient sollicités pour résoudre des tickets, relire du code d’autrui, interagir avec des contributeurs novices ou encore structurer le projet dans son ensemble. Cette surcharge de coordination nuit souvent à la contribution technique directe des personnes les plus expérimentées.

L’introduction d’un outil comme GitHub Copilot, qui permet d’automatiser ou d’accélérer la production de code, modifie potentiellement cette dynamique. La question posée par les auteurs est donc de savoir si l’accès à une intelligence artificielle générative conduit les travailleurs concernés à réorienter leur temps vers les activités les plus essentielles — dans le cas étudié, le codage — et à se désengager, au moins partiellement, des activités périphériques, notamment la gestion de projet. Pour répondre à cette question, les auteurs ont formulé une série d’hypothèses relatives à la réallocation des tâches, à la nature des interactions sociales, au degré d’exploration ou de spécialisation des activités, ainsi qu’à la variation des effets selon le niveau de compétence initial des utilisateurs.

Dans leur cadre méthodologique, les auteurs ont retenu un échantillon de plus de 50 000 développeurs actifs identifiés comme mainteneurs sur GitHub, c’est-à-dire des individus jouant un rôle clé dans la coordination et la validation du travail sur les projets. Les données couvrent la période allant de juin 2022 à juin 2023 et combinent des informations publiques issues de la plateforme avec des données confidentielles fournies par GitHub concernant l’accès à Copilot. Les chercheurs distinguent deux grandes catégories d’activités : d’une part le codage, qui inclut la création de dépôts, les ajouts de code, les pushs et autres actions de développement technique ; d’autre part la gestion de projet, qui englobe la gestion des tickets (issues), les relectures de code, l’attribution des tâches à d’autres membres de l’équipe, ou encore la participation aux discussions techniques. Ces catégories leur permettent de quantifier la part relative consacrée à chaque type d’activité avant et après l’accès à l’outil d’IA.

L’analyse empirique repose sur une technique d’estimation dite de régression par discontinuité, exploitant le fait que le classement déterminant l’éligibilité au programme de gratuité de Copilot est inconnu des développeurs, et donc non manipulable. En comparant les comportements de développeurs très proches de part et d’autre du seuil d’éligibilité, les auteurs parviennent à isoler l’effet causal de l’accès à l’outil. Ils testent par ailleurs la robustesse de leurs résultats à l’aide de méthodes alternatives.

Les résultats principaux sont notables. L’accès à Copilot induit une augmentation significative de la part de temps consacré au codage (+5,4 points de pourcentage en moyenne, soit une hausse relative de 12,4 %), et une réduction tout aussi marquée de la part allouée à la gestion de projet (−10 points de pourcentage, soit une baisse relative de 24,9 %). Ce rééquilibrage en faveur du cœur de métier suggère que l’intelligence artificielle agit comme un levier de recentrage du travail technique, en libérant les individus des tâches les plus consommatrices en coordination. Il s’agit ici non pas seulement d’un gain d’efficacité, mais d’une transformation qualitative de la structure même du travail.

En approfondissant l’analyse, les auteurs montrent que cette reconfiguration s’accompagne d’une transformation du mode de collaboration. Les développeurs ayant accès à Copilot interagissent moins avec leurs pairs : ils forment des groupes plus restreints, sollicitent moins de relectures, assignent moins de tâches à autrui, et ferment les tickets plus rapidement. En d’autres termes, l’IA leur permet d’agir plus en autonomie, en contournant les frictions de collaboration inhérentes au travail distribué. Cela ne signifie pas une disparition du collectif, mais plutôt une réduction du besoin de coordination explicite, remplacée en partie par la capacité de l’IA à générer du code, à proposer des solutions ou à accompagner l’utilisateur dans sa logique de raisonnement.

Par ailleurs, l’étude montre que les utilisateurs de Copilot tendent à s’orienter vers de nouveaux projets, à explorer de nouveaux langages de programmation, et à élargir leur spectre d’action. Cette dynamique d’exploration est interprétée comme un effet indirect de la réduction des coûts cognitifs d’entrée sur un nouveau territoire technologique. En permettant une montée en compétence accélérée, l’IA rend plus accessibles des domaines techniques jusqu’alors réservés à des spécialistes. Les développeurs accèdent ainsi plus fréquemment à des technologies mieux rémunérées, ce qui se traduit, selon les estimations des auteurs, par un potentiel de valorisation salariale annuelle de près de 1 700 dollars par personne.

Un point particulièrement saillant de l’étude concerne l’hétérogénéité des effets selon le niveau de compétence initial. Les développeurs les moins expérimentés — mesurés par divers indicateurs tels que l’ancienneté sur la plateforme, le nombre de suiveurs, ou encore le centralité des contributions — bénéficient davantage de l’IA que leurs homologues plus chevronnés. Ils recentrent plus fortement leur activité sur le codage et délestent davantage les tâches de coordination. Cette observation corrobore l’idée selon laquelle l’intelligence artificielle générative pourrait jouer un rôle d’égalisation des capacités, en augmentant de manière disproportionnée la productivité des profils moins aguerris. Dans un contexte où les projets open source sont souvent confrontés à un déséquilibre entre une base large de contributeurs occasionnels et un petit noyau de mainteneurs surchargés, cette redistribution des capacités apparaît porteuse d’effets positifs.

L’impact de Copilot ne se limite pas à une amélioration de la répartition des tâches : les auteurs vérifient également que la qualité des contributions n’est pas dégradée, bien au contraire. Les projets bénéficiant d’un accès à l’IA présentent un taux de vulnérabilités critiques réduit de plus de 30 %, signe que l’assistance apportée par l’IA ne se fait pas au détriment de la sécurité ou de la fiabilité du code produit. Cela contredit certaines inquiétudes selon lesquelles l’automatisation du développement pourrait introduire des erreurs ou des failles non détectées.

Les implications de cette étude pour le monde du travail, notamment dans un cadre juridique et organisationnel, sont nombreuses. Le premier enseignement concerne la redéfinition des postes dans les métiers techniques : les outils d’IA permettent une spécialisation accrue des tâches et pourraient justifier une actualisation des descriptions de fonctions, notamment pour refléter une moindre nécessité de coordination humaine. Le deuxième concerne l’impact potentiel sur les structures hiérarchiques. Si l’IA permet à chacun de résoudre des problèmes de manière autonome, elle diminue mécaniquement le besoin de supervision intermédiaire, ce qui pourrait conduire à un aplatissement des structures organisationnelles. Troisièmement, les effets redistributifs de l’IA sur les compétences posent la question de l’évaluation des performances, des grilles salariales et des parcours de progression. Le fait que les moins expérimentés en tirent davantage parti interroge sur les politiques de formation, d’encadrement ou de mentorat. Enfin, la nature du lien de subordination pourrait être affectée, dans la mesure où les collaborateurs deviennent plus autonomes dans leur manière de s’organiser, ce qui remet en cause certaines pratiques de contrôle managérial fondées sur la présence, le reporting ou l’intermédiation humaine.

Les auteurs concluent leur étude en soulignant que leur approche, fondée sur une observation fine, longue et naturaliste des effets de l’IA, permet de dépasser les limites des expérimentations en laboratoire, souvent restreintes à de petits échantillons sur des durées courtes. En révélant les transformations de fond à l’œuvre dans le travail distribué et dans la production de biens communs numériques, leur travail offre un éclairage précieux à la fois pour les chercheurs, les décideurs publics, les responsables des ressources humaines et les praticiens du droit. Il invite à repenser la manière dont les outils d’IA s’intègrent dans les chaînes de valeur, comment ils redéfinissent les contours du travail qualifié, et comment ils modifient les équilibres collectifs au sein des organisations.

En somme, cette étude ne se contente pas de constater des gains de productivité. Elle soutient que l’intelligence artificielle générative agit comme un catalyseur de transformation des pratiques professionnelles, en redistribuant les tâches, en favorisant l’autonomie, en stimulant l’exploration et en corrigeant partiellement les asymétries de compétence. Dans une perspective juridique, elle ouvre la voie à une réflexion profonde sur l’évolution du contrat de travail, sur la définition des fonctions, sur les critères de rémunération et sur la gouvernance des relations professionnelles à l’ère de l’intelligence artificielle.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence artificielle

Publié dans intelligence artificielle | Tagué , , , | Laisser un commentaire

Kiss Cam, adultère et résiliation des rapports de travail

On a beaucoup parlé des Kiss Cams ces derniers jours, i.e. des ces dispositifs qui, dans les grandes enceintes sportives ou récréatives, parcourent la foule et individualisent des couples qui sont alors censés s’embrasser sur grand écran pendant un temps mort, une pause pendant un concert, etc. sous les applaudissements de la foule. Il y eu toutefois, lors d’un récent concert de Coldplay, un léger problème : le couple mis en valeur par la Kiss Cam était adultère, et Monsieur, CEO d’une boite de la tech, enlaçait tendrement sa responsable des ressources humaines, et non sa tendre moitié. Celle-ci – en citoyenne américaine moderne – a instantanément effacé son nom de femme mariée de ses « réseaux sociaux » (comme on dit). L’employeur a, quant à lui, pris acte de la « démission » de son CEO, dont il a jugé qu’il avait gravement failli à ses obligations.

Et en Suisse ?

Dans un curieux ATF 129 III 380, consid. 3.2, le Tribunal fédéral avait refusé de reconnaître le caractère justifié d’un licenciement avec effet immédiat d’une employée qui entretenait des relations coupables avec l’époux de la directrice générale et administratrice unique de l’employeur, et en était l’actionnaire unique, quand bien même l’intéressée travaillait dans ce qui était aussi le domicile conjugal. Le Tribunal fédéral semble en effet avoir retenu que l’employeur était une personne morale (pas de Durchgriff ??) et que celle-ci devrait pouvoir se prévaloir de son indépendance juridique. Le cas ne pouvait être considéré comme identique à celui où la relation concernerait le mari de l’employeur lui-même [i.e. l’employeur comme personne physique]. On ne pourrait en effet exclure qu’une relation avec le mari de la directrice dans ce cas puisse empoisonner les relations de travail au point de justifier une résiliation extraordinaire du contrat. Par ailleurs le mariage entre la directrice et son époux apparaissait déjà « brisé » avant l’adultère.

Je ne sais pas trop ce qu’il faut conclure de cette curiosité, mais le Tribunal fédéral ne semble en tout cas pas écarter l’idée, a priori, que l’on puisse retenir qu’un adultère puisse aboutir à la résiliation – même immédiate – des rapports de travail.

Me Philippe Ehrenström, avocat, LLM

Publié dans Libertés, Licenciement abusif, Licenciement immédiat | Tagué , , , , | Laisser un commentaire