Depuis l’irruption des outils d’intelligence artificielle (IA), les menaces sur les droits d’auteur et la propriété intellectuelle ont été largement discutées dans la musique, l’écrit et l’image. En revanche, la valorisation des données et des œuvres détenues par les opérateurs culturels publics et privés reste peu explorée, alors que les acteurs de l’IA recherchent des données de qualité pour entraîner leurs modèles.
Les relations entre musées, bibliothèques, archives, opérateurs audiovisuels et l’IA existent déjà, par exemple dans le domaine de la conservation, la reconnaissance d’écriture manuscrite, l’identification d’œuvres et la médiation avec le public. Jusqu’ici, l’IA a surtout représenté des dépenses, en contrepartie de gains de productivité ou de nouveaux services. Mais la valorisation des collections comme données d’entraînement, source potentielle de revenus propres, reste marginale, alors que les corpus littéraires, historiques ou artistiques de qualité sont à l’évidence particulièrement précieux. Cette perspective soulève des enjeux économiques et juridiques importants.
Aux États-Unis, par une ordonnance très commentée du 23 juin 2025 (Bartz v. Anthropic), un juge fédéral américain a décidé que l’entraînement d’une IA sur des œuvres protégées n’est pas en soi une violation du droit d’auteur si l’usage est “transformateur” (Fair Use), exception propre au droit américain. En revanche, il a aussi été jugé que le simple fait d'utiliser des œuvres téléchargées depuis des sources illégales constituait une infraction ouvrant droit à indemnisation. Plusieurs actions visent déjà de grands acteurs accusés d’avoir utilisé des millions de livres issus de “bibliothèques fantômes”. La sécurisation juridique de l’utilisation des données est donc centrale, tant pour les détenteurs de droits que pour les entreprises d’IA.
Plutôt que la voie judiciaire, certaines sociétés ont préféré conclure des accords financiers substantiels avec les titulaires de droits, reconnaissant ainsi la valeur économique des données. Cela ouvre la voie à des discussions contractuelles, mais pose aussi de redoutables questions pratiques, notamment en ce qui concerne la traçabilité, l’identification des ayants droit, voire la répartition des compensations. La création de fonds de règlement pourrait offrir une solution et les organismes de gestion collective, qui ont une expertise avérée dans la redistribution des droits d’auteur et des droits voisins sont sans doute les premiers intéressés. Les détenteurs des œuvres eux-mêmes pourraient sans doute aussi jouer un rôle d’intermédiaire.
En France, les œuvres du domaine public sont librement utilisables, y compris par les IA, sous réserve du respect du droit moral (Code de la propriété intellectuelle (CPI), art. L. 121-1 et suivants). Elles peuvent donc être numérisées, analysées, exploitées et réutilisées, même commercialement, sans autorisation ni redevance. La loi n° 2016-1321 du 7 octobre 2016, dite “pour la République numérique”, est allée plus loin : elle impose aux établissements publics de mettre gratuitement à disposition les informations publiques qu’ils produisent, notamment métadonnées, catalogues, notices et reproductions d’œuvres du domaine public. Ainsi, un manuscrit du XVIIIe siècle peut être intégré sans difficulté dans les bases d’entraînement d’une IA. Une redevance limitée aux coûts de numérisation et diffusion peut toutefois être perçue lorsque la réutilisation fait l’objet d’une licence (Code des relations entre le public et l’administration (CRPA), art. L. 324-2), à l’initiative de l’opérateur public et le pouvoir réglementaire a défini le cadre des outils utilisables (CRPA, L. 323-1 et 2, art. D. 323-2-1).
Pour les œuvres protégées conservées au titre du dépôt légal ou dans des collections privées, l’autorisation des titulaires de droits est indispensable si elles doivent servir à l’entraînement d’IA. La directive européenne 2019/790 (art. 3), transposée en droit français (CPI art. L122-5-3), prévoit une exception de “Text and data mining” (TDM) au bénéfice d’organismes de recherche et d’institutions patrimoniales, difficile à invoquer par les entreprises technologiques. De plus, les ayants droit peuvent activer un opt-out, rendant la licence obligatoire si l’utilisation est traçable. Ainsi, un musée souhaitant entraîner une IA sur des catalogues contemporains devra vérifier si les œuvres relèvent de l’exception TDM ou négocier une licence. Ce champ ouvre des perspectives de valorisation pour les institutions, publiques comme privées, qui détiennent des œuvres à divers titres et pourraient négocier l’usage de leurs données comme ressources d’entraînement, percevoir le prix des licences et assurer le reversement aux ayants droit.
Ces problématiques sont encore largement inédites. Juridictions et législateurs auront du mal à suivre le rythme des innovations, mais les prochains mois apporteront des réponses décisives. D’où la nécessité, pour tous les acteurs concernés, d'assurer une veille sur les évolutions de ce domaine en pleine mutation, alors que la Commission européenne vient de publier sa stratégie en matière d’IA (Apply AI Strategy), notamment pour le monde de la culture et des secteurs créatifs.