Musique, intelligence artificielle et Large Language Models

Quelques éléments de réflexion tirés de D. Gervais, Observations on the Role of Copyright in Shaping Music Industry Use of Large Language Models (August 04, 2025). Intellect Handbook of Global Music Industries (Chris Anderton, editor), Available at SSRN: https://ssrn.com/abstract=5388435 or http://dx.doi.org/10.2139/ssrn.5388435):

Le droit, dans son essence, est un outil d’organisation sociale. Il fixe des règles qui orientent, encouragent ou limitent certaines activités humaines. Cette fonction est universelle : qu’il s’agisse de régir la circulation routière, les échanges commerciaux ou les créations artistiques, le droit établit un cadre dans lequel les comportements s’inscrivent.

Dans le domaine de la propriété intellectuelle, et en particulier du droit d’auteur, cette mission prend une forme spécifique. Les législateurs ont historiquement cherché à stimuler la création en accordant aux auteurs des droits exclusifs sur leurs œuvres. Ces droits, patrimoniaux et moraux, permettent aux créateurs de contrôler l’utilisation de leurs œuvres et d’en tirer un revenu, tout en prévoyant des sanctions dissuasives contre toute utilisation non autorisée.

Ce mécanisme repose sur un équilibre délicat. Trop de protection, trop longue ou trop large, peut freiner l’accès aux œuvres et limiter l’innovation ; trop peu de protection, et les créateurs peuvent être découragés de produire, faute de retour sur investissement. Cette question d’équilibre est d’autant plus cruciale que de nombreuses innovations se développent même en dehors du système de la propriété intellectuelle. Certaines naissent grâce à des mécanismes comme l’ingénierie inverse (reverse engineering), qui consiste à analyser un produit fini pour comprendre son fonctionnement, d’autres sont stimulées par la simple concurrence commerciale.

La musique est un terrain privilégié pour observer cette dynamique. Depuis plus d’un siècle, elle est protégée par le droit d’auteur, les droits voisins des artistes interprètes et des producteurs, et a vu ce cadre s’adapter à chaque grande mutation technologique : la radio, la télévision, les supports enregistrés, les services de streaming. Chaque innovation a apporté de nouvelles possibilités et de nouveaux défis, poussant le législateur à ajuster les droits exclusifs et les exceptions pour maintenir la vitalité du secteur.

Aujourd’hui, nous entrons dans une nouvelle ère : celle de l’intelligence artificielle générative et des grands modèles de langage appliqués à la musique. Ces systèmes peuvent composer des mélodies, écrire des paroles, transposer un morceau dans un autre style, ou imiter la « patte » d’un artiste. Leur particularité ? Ils n’ont aucune motivation humaine, aucun vécu, aucun ressenti ; leur « créativité » est le produit de calculs statistiques sur d’immenses bases de données musicales. C’est un bouleversement historique : pour la première fois depuis le Statute of Anne de 1710, fondateur du droit d’auteur moderne, la créativité non humaine devient une réalité concurrente à celle des auteurs humains.

Trois grandes questions émergent alors :

Peut-on légalement utiliser des catalogues musicaux protégés pour entraîner ces modèles ?

Les morceaux produits par ces systèmes peuvent-ils violer des droits d’auteur existants ?

Peut-on protéger, par le droit d’auteur, une œuvre créée par une machine ?

Pour répondre, l’auteur de l’article propose de commencer par un détour technique pour comprendre comment ces systèmes fonctionnent, puis d’analyser successivement chacune des trois questions, avant de conclure sur les implications à long terme pour la création musicale et la société.

Les dessous techniques des LLM musicaux

Un grand modèle de langage, ou LLM, est un système d’intelligence artificielle qui apprend à produire du contenu – texte, image, musique – en analysant d’énormes ensembles de données. Il fait partie de la famille de l’apprentissage automatique, où un algorithme « s’entraîne » en repérant des régularités dans les données qu’on lui fournit.

Dans le cas de la musique, l’entraînement commence par la copie intégrale de morceaux, qu’ils soient sous forme de partitions, d’enregistrements audio ou de fichiers MIDI. Cette copie n’est pas un simple accès : les œuvres sont téléchargées et stockées dans l’environnement technique du développeur. Elles sont ensuite « tokenisées » : découpées en petites unités – notes, accords, séquences rythmiques ou phonèmes pour les paroles – qui sont ensuite converties en valeurs numériques.

Ces tokens conservent entre eux des relations contextuelles : ce ne sont pas des morceaux isolés jetés pêle-mêle, mais des fragments reliés par des « fils invisibles » qui reflètent la structure et la logique de l’œuvre d’origine. C’est ce qui permet, lors de la génération, de reconstituer des séquences qui peuvent être très proches de l’original.

La tokenisation s’accompagne souvent de la suppression d’informations de gestion des droits (RMI), comme le nom de l’auteur ou l’éditeur. Or, cette suppression ou altération est réglementée par les traités internationaux, car elle peut faciliter des utilisations non autorisées.

Une fois entraîné, le modèle fonctionne comme un prédicteur : à partir d’un point de départ (une note, un accord, un mot), il calcule la suite la plus probable en se basant sur ce qu’il a appris. C’est ici qu’intervient l’humain via le « prompt » : une instruction plus ou moins précise qui oriente la production.

Le cadre juridique international

Le droit d’auteur protège les œuvres originales, qu’elles soient littéraires, artistiques ou musicales. Les droits patrimoniaux incluent le droit de reproduction, d’adaptation, de distribution, de communication au public. Les droits moraux permettent notamment de revendiquer la paternité de l’œuvre et de s’opposer à toute modification préjudiciable à l’honneur ou à la réputation de l’auteur.

La Convention de Berne, adoptée en 1886 et aujourd’hui forte de 181 membres, impose un socle commun de protection. L’Accord sur les ADPIC (TRIPS), intégré à l’OMC, rend ces obligations contraignantes et exécutoires. Le Traité OMPI de 1996 renforce la protection, notamment contre la suppression des RMI et le contournement des mesures techniques.

À côté de ces droits, les droits voisins protègent les interprètes et producteurs de phonogrammes. Ils ne sont pas identiques au droit d’auteur, mais offrent des prérogatives comparables pour la reproduction et la communication au public.

Entraîner une IA sur des œuvres protégées : légal ou pas ?

Le fait qu’une œuvre soit en ligne ne signifie pas qu’elle est libre de droits. En droit suisse comme en droit international, toute reproduction, même temporaire, nécessite une autorisation, sauf exception. L’entraînement d’un LLM implique de copier les œuvres dans leur intégralité, puis de les conserver sous forme tokenisée.

En Europe, la directive 2019 prévoit deux exceptions pour le text and data mining : l’une réservée à la recherche scientifique par des institutions habilitées, l’autre plus large mais assortie d’un droit d’opt-out pour les titulaires de droits. En Suisse, la loi sur le droit d’auteur contient depuis 2020 une exception pour la fouille de textes et de données, mais qui respecte les conditions et limitations imposées par les traités internationaux.

Aux États-Unis, l’incertitude règne : la doctrine du fair use pourrait, selon les circonstances, couvrir certains entraînements, mais aucun consensus jurisprudentiel clair ne s’est encore dégagé.

L’argument souvent avancé par les développeurs – que la tokenisation ne reproduirait que des « idées » et non des expressions – est réfuté : les tokens contiennent des éléments d’expression protégés. Comparer l’entraînement machine à l’apprentissage humain est trompeur, car l’humain assimile et transforme, tandis que la machine copie mécaniquement et stocke.

Les sorties d’un LLM : quand y a-t-il infraction ?

La question ici est classique : une œuvre générée reproduit-elle une partie substantielle d’une œuvre préexistante ? Cela inclut les copies exactes, mais aussi les adaptations, traductions ou arrangements.

Il existe un débat doctrinal sur la question de savoir si toute sortie d’un LLM, du fait qu’elle est influencée par les œuvres d’entraînement, est automatiquement une œuvre dérivée. Les juridictions, en Europe comme aux États-Unis, n’ont pas retenu cette approche globale. L’analyse se fait au cas par cas, selon la similarité substantielle et la preuve de l’accès aux œuvres originales.

Un auteur non humain peut-il exister ?

La réponse majoritaire est non. Depuis plus de trois siècles, le droit d’auteur protège les créations humaines. L’originalité, en Europe, se définit comme l’expression de la personnalité de l’auteur à travers des choix libres et créatifs. Aux États-Unis, la Cour suprême, dans l’affaire Feist, a confirmé que le droit d’auteur protège la créativité et non le simple travail ou investissement (« sweat of the brow »).

Les machines, aussi sophistiquées soient-elles, ne prennent pas de décisions créatives au sens juridique : elles appliquent des algorithmes pour optimiser une probabilité statistique. Les décisions récentes de l’US Copyright Office et de tribunaux fédéraux confirment que l’absence d’auteur humain empêche la protection.

La collaboration homme-machine

L’IA peut être un outil d’assistance : aider à trouver une mélodie, suggérer des paroles, optimiser une harmonie. Dans ce cas, si l’humain conserve un rôle créatif significatif et identifiable, l’œuvre peut rester protégée.

L’auteur propose un test : rechercher la cause « proche » de l’originalité. Si les éléments originaux sont imputables à l’humain, la protection s’applique ; si l’originalité est produite exclusivement par la machine, l’œuvre tombe dans le domaine public.

Cela suppose de séparer les apports fonctionnels ou aléatoires de la machine et de vérifier que l’humain a exercé un contrôle créatif réel. Cette approche rappelle les analyses faites en matière d’œuvres en collaboration ou de transformations d’œuvres du domaine public.

Perspectives et conclusion

Nous sommes entrés dans une ère où les « esprits artificiels » participent à la création musicale. Cette évolution présente des risques : remplacement progressif des auteurs humains, appauvrissement de la diversité culturelle, perte d’opportunités pour les nouvelles générations de créateurs.

L’auteur plaide pour un cadre clair : les œuvres purement générées par des machines doivent rester sans protection ; les créateurs doivent être rémunérés lorsque leurs œuvres sont utilisées pour entraîner des systèmes qui produisent des contenus concurrents ; la transparence sur la part de contenus IA dans les flux commerciaux doit être imposée.

En définitive, le droit d’auteur doit, comme il l’a toujours fait, s’adapter à la technologie pour préserver la valeur irremplaçable de la créativité humaine dans un paysage artistique où l’IA est désormais un acteur à part entière.

Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle

Avatar de Inconnu

About Me Philippe Ehrenström

Ce blog présente certains thèmes juridiques en Suisse ainsi que des questions d'actualité. Il est rédigé par Me Philippe Ehrenström, avocat indépendant, LL.M., Yverdon-les-Bains
Cet article, publié dans droit d'auteur, intelligence artificielle, est tagué , , , , . Ajoutez ce permalien à vos favoris.

Laisser un commentaire