
Quelques réflexions tirées d’Andres Guadamuz, Communication to the public is about to shape the future of AI copyright, 14 septembre 2025 (https://www.technollama.co.uk/communication-to-the-public-is-about-to-shape-the-future-of-ai-copyright):
L’auteur situe le débat actuel autour du droit d’auteur et de l’intelligence artificielle dans ce qu’il appelle un « cycle de régulation ».
En observant les précédentes révolutions technologiques, il note que l’on commence toujours par des litiges sur l’utilisation de contenus protégés lors de la phase de développement. Aujourd’hui, ce sont donc les « input cases » qui dominent, c’est-à-dire les affaires où l’on discute du fait de nourrir un modèle d’IA avec des contenus trouvés en ligne sans autorisation des titulaires de droits. Plusieurs procès ont été intentés, certains commencent à se conclure par des transactions, comme Bartz v. Anthropic. Pour l’auteur, cette tendance annonce une stabilisation progressive. L’histoire montre que la technologie finit par s’imposer, le droit évoluant pour permettre son existence, quitte à fragiliser les positions des acteurs historiques. Internet a connu une trajectoire semblable : d’abord perçu comme une menace pour les titulaires de droits, il a ensuite été encadré par des mécanismes de retrait de contenus illicites, ce qui a permis aux intermédiaires de survivre. De même, les guerres du peer-to-peer se sont soldées par la défaite du piratage massif, mais ont ouvert la voie aux services légaux de streaming qui dominent aujourd’hui.
Transposé à l’IA, le raisonnement conduit à penser que l’usage massif de ces technologies rend illusoire toute interdiction stricte. On devrait plutôt assister à une généralisation des régimes d’opt-out permettant aux titulaires de s’opposer à l’utilisation de leurs œuvres, et au développement de solutions de licence. Les grands groupes médiatiques pourront ainsi former leurs propres modèles sur leurs catalogues ou monétiser l’accès à leurs contenus pour les besoins d’autres développeurs. À terme, l’entraînement deviendra un fait acquis, semblable à la tolérance juridique qui a permis à Internet de se développer, et les flux de revenus apparaîtront ensuite.
Mais la fin des contentieux sur l’entraînement ne mettra pas fin aux litiges. Une nouvelle phase s’ouvrira, celle des « output cases ».
Des procès sont déjà engagés, par exemple Disney et Warner Bros contre Midjourney, portant non plus sur les données utilisées mais sur les résultats produits. Ces affaires devront déterminer si les images générées reproduisent effectivement des œuvres protégées. Dans ce contexte, la question de la responsabilité des intermédiaires sera cruciale : les développeurs d’IA doivent-ils être considérés comme de simples fournisseurs d’outils, ou comme responsables des infractions commises par leurs utilisateurs ?
Un autre axe de contentieux pourrait s’affirmer : la notion de « communication au public ». L’auteur rappelle qu’il avait jusqu’ici minimisé son importance, mais que certains commentateurs y voyaient déjà une clé dans l’affaire LAION. Cette organisation avait constitué une base de données massive d’images indexées par des URL, sans héberger elle-même les fichiers. Certains ont soutenu que la mise à disposition de ces liens constituait une communication au public. L’auteur s’était montré sceptique, estimant qu’un utilisateur ne pourrait guère retrouver facilement une image précise à partir de ce corpus.
En Europe, la notion de communication au public demeure mouvante. Depuis dix ans, la Cour de justice de l’Union européenne (CJUE) a rendu de nombreux arrêts afin de préciser quand le fait de lier, de cadrer ou de diffuser des contenus constitue une communication à un « nouveau public ». La jurisprudence est abondante mais fragmentée, créant une grande incertitude pour les intermédiaires. Les titulaires y ont trouvé un outil puissant, mais son application aux bases de données d’entraînement et aux résultats d’IA n’a pas encore été tranchée.
Le litige Like Company v. Google illustre les enjeux à venir. Sans entrer dans les détails, l’auteur y voit le signe que la question de la communication au public sera bientôt au cœur du contentieux de l’IA. À cela s’ajoute une évolution technique : une fois un modèle entraîné, d’autres opérations peuvent être réalisées, telles que l’inférence, le fine-tuning et la génération augmentée par recherche (retrieval-augmented generation, RAG). L’inférence consiste à utiliser le modèle tel quel pour produire des résultats. Le fine-tuning est un nouvel entraînement sur un corpus restreint afin d’adapter le modèle à un usage spécifique. La RAG permet d’interroger des sources externes en temps réel afin de compléter les réponses.
Ces pratiques soulèvent des interrogations. Si le modèle de base a été entraîné légalement, les actions postérieures peuvent-elles néanmoins engager la responsabilité des opérateurs ? Certains projets parlementaires européens envisagent d’imposer des obligations de transparence sur les données utilisées lors de l’inférence, du fine-tuning et de la RAG. L’auteur n’y est pas favorable, mais il estime que la vraie question est celle d’éventuelles actions en justice dirigées non plus contre les développeurs initiaux, mais contre ceux qui exploitent les modèles après entraînement.
S’agissant de l’inférence, il ne voit pas de difficulté juridique particulière, puisque le modèle reste inchangé. Le fine-tuning, en revanche, peut poser problème si les données additionnelles utilisées sont protégées. Mais il s’agirait d’une difficulté analogue à celle de l’entraînement initial, pouvant être résolue par la même analyse : soit c’est licite, soit c’est une contrefaçon.
Le cas le plus intéressant est celui de la RAG. De nombreux modèles de langage recourent désormais à ce procédé, qui améliore la précision et réduit les hallucinations. Mais juridiquement, il soulève une question : le fait de citer ou de résumer en temps réel des contenus extérieurs pourrait-il constituer une communication au public ? L’auteur prend l’exemple d’une recherche sur Perplexity : la réponse inclut des liens vers des articles, dont son propre blog. Si certains titulaires se réjouissent de cette visibilité, d’autres pourraient considérer qu’il s’agit d’une communication à un public nouveau.
Un autre problème tient à l’effet de substitution. Si l’utilisateur obtient déjà une réponse complète dans l’interface d’IA, il n’a plus besoin de visiter le site d’origine. Certains éditeurs affirment d’ailleurs que leur trafic baisse en raison des réponses générées directement par Google ou par des modèles intégrant la RAG. Pour l’auteur, cet argument pourrait alimenter à l’avenir des revendications fondées sur la communication au public ou sur un droit voisin des éditeurs de presse.
La situation rappelle les litiges plus anciens sur l’agrégation, l’encadrement ou l’hyperlien, où les juges ont dû décider si le fait de renvoyer ou de résumer un contenu tiers constituait une communication à un nouveau public. La jurisprudence a souvent retenu que non, sauf si des restrictions techniques étaient contournées. Toutefois, la différence ici est que l’IA peut décourager la consultation du site original en remplaçant purement et simplement la visite. Cette substitution pourrait donner aux demandeurs de nouveaux arguments.
Ainsi, l’auteur conclut que la question de la communication au public est appelée à prendre une importance croissante dans les contentieux liés à l’IA. Même si lui-même n’est pas convaincu que les conditions soient réunies, il prévoit que des titulaires chercheront à utiliser ce fondement pour attaquer les services de génération de contenus, notamment ceux recourant à la RAG. Comme souvent dans l’histoire des technologies, les litiges se poursuivront sans relâche, traduisant l’adaptation permanente du droit d’auteur à de nouveaux usages.
Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle