Licence Creative Commons (2/4) IA génératives et création : "Les input : les enjeux du Text and Data Mining"

27 mars 2023
Durée : 01:11:07
Nombre de vues 109
Nombre d’ajouts dans une liste de lecture 0
Nombre de favoris 0

Dans le cadre de la conférence “IA générative et création : quels enjeux juridiques ?” organisée à l'université Paris 1 Panthéon-Sorbonne, le 27 mars 2023 par les professeurs Célia Zolynski (Observatoire de l'Intelligence artificielle de Paris 1) et Édouard Treppoz (Institut de recherche juridique de la Sorbonne (IRJS), cette table ronde visait à l’appréhension par le droit d’auteur des actes de fouilles accomplis par l’IA générative et l’exception du Text and Data Mining (TDM) qui est le processus d'extraction d'informations à partir de matériel lu par une machine. Ce dernier fonctionne en copiant de grandes quantités de matériel, en extrayant les données et en les recombinant pour identifier des modèles. Ce thème soulève donc de nombreux questionnements importants aussi bien au stade des inputs concernant les enjeux de Text and Data Mining que des outputs relatifs aux enjeux pour les créateurs et le droit d’auteur.

Cette table ronde était animée par Tristan Azzi, Professeur de droit, université Paris 1 Panthéon-Sorbonne et avait pour panélistes :

  • Edouard Treppoz, Professeur de droit, université Paris 1 Panthéon-Sorbonne (Présentation)
  • Arnaud Robert, Secrétaire général, Groupe Hachette Livre 
  • Noémie Enser, Avocat, Cabinet Vercken et Gaullier

Voici les différents sujets qui y ont été abordés :

1. L’application du droit d’auteur aux copies effectuées par l’IA générative
En vue de produire du texte ou des images, l’IA générative doit ingérer de nombreuses données parmi lesquelles peuvent figurer des contenus protégés par droit d’auteur. Afin de pouvoir exploiter ces œuvres sous forme de données, l’IA générative réalise des copies provisoires. Dès lors, il convient de se demander si les copies effectuées au sein des IA génératives constituent des actes de reproduction au sens du droit d’auteur et nécessitent, le cas échéant, l’autorisation de l’auteur.

Contrairement au droit français, le droit de reproduction au sens du droit européen n’implique aucun acte ultérieur de communication au public (1). Dès lors, la copie faite au sein d’une IA générative pourrait constituer un acte de reproduction, bien que la question soit encore ouverte. En conséquence, la question se pose de savoir si l’exception de TDM (équivalant à la fouille de textes et de données en français) introduite par le droit européen s’applique aux reproductions effectuées au sein des IA génératives.

Dans un premier temps, la réponse européenne a été de considérer qu’il fallait autoriser les fouilles de textes dans le cadre des IA classiques. Pour rappel, la directive (UE) 2019/790  du 17 avril 2019 sur le droit d'auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE dite directive DAMUN définit la fouille de textes et de données comme étant « toute technique d’analyse automatisée visant à analyser des textes et des données sous une forme numérique afin d’en dégager des informations, ce qui comprend, à titre non exhaustif, des constantes, des tendances et des corrélations » (2). Ladite directive oblige les États membres à prévoir au sein de leur législation cette exception de TDM, d’une part, au profit des organismes et institutions du patrimoine culturel à des fins de recherches scientifiques (3), et d’autre part, de manière générale à toutes fins bénéficiant à toutes personnes (4).

Dans un deuxième temps, la réponse est moins certaine concernant l’application de l’exception de TDM aux IA génératives. Au regard du considérant 18 de la directive DAMUN, cette exception semble avoir été créée pour des IA opérants à des fins statistiques et dont la conservation des copies est possible pendant toute la durée nécessaire aux fins de cette fouille de textes et de données. Or dans une IA générative, la conservation de ces données doit être infinie puisqu’elle doit constamment apprendre de ces derniers pour pouvoir répondre aux requêtes.

2. Les conditions de l’exception de TDM
Afin de bénéficier de cette exception de TDM, les articles 3 et 4 de la directive DAMUN posent un certain nombre de conditions. 

  • Tout d’abord, les deux articles prévoient la nécessaire licéité de l’accès à l'œuvre. Cette condition appelle un certain nombre de questions complexes, à savoir : comment déterminer si cet accès a effectivement été licite ? Comment la Cour de Justice de l’Union européenne va-t-elle appréhender cette condition de licéité ? 
  • L’article 3 dudit texte prévoit par ailleurs la nécessité de stocker la copie avec un niveau de sécurité approprié. Cependant, qui est capable de juger d’un niveau de sécurité approprié ? En outre, cet article prévoit également la destruction de la copie à l’issue de la fouille, mais comment vérifier l’effectivité de cette destruction ? 
  • Enfin, l’article 4 de la directive DAMUN envisage, quant à lui, la condition d’absence d’opposition par le titulaire de droit, autrement appelé mécanisme d’opt-out. Il permet aux titulaires de droits de s’opposer de manière discrétionnaire à la fouille de textes sur leurs œuvres. Toutefois, ce mécanisme soulève également un certain nombre d'interrogations. En effet, quel type de procédé va pouvoir être mis en œuvre pour rendre ce mécanisme lisible par la machine ? Ce procédé sera-t-il fiable ? Comment savoir si l'œuvre a effectivement été retirée des bases et comment le prouver ? Comment l'exécution de l’opt-out va-t-il pouvoir être contrôlée en pratique ? 

Les réponses apportées permettront de sécuriser, ou non, la logique de ce mécanisme d’opt-out. Afin d’illustrer concrètement ce mécanisme d’opt-out, la société Hachette a par exemple eu l’occasion de modifier ses contrats de distribution e-book avec les grands opérateurs (Google, Amazon, etc.) afin de leur interdire de réaliser des opérations d’IA sur le corpus de texte d’e-book dont ils disposent en intégralité. En outre, la société crée actuellement des dispositifs de réservation de droits lisibles par la machine qui visent à protéger leurs contenus librement accessibles. 

3. L’application du fair use ?
Aux États-Unis, la question se pose de savoir si les reproductions d'œuvres au sein des IA génératives pourraient être appréciées au travers de l’exception du fair use. À ce titre, une class action très récente menée par les artistes Andersen, McKernan et Ortiz à l’encontre de Midjourney et de Stability AI donnera l’application du fair use sur le marché des œuvres créatives.

4. Le triple test
Enfin, le débat s’est orienté vers la conformité de l’exception du TDM au triple test du droit européen. Pour rappel, le triple test prévoit que les exceptions prévues au droit d’auteur ne peuvent porter atteinte à l’exploitation normale de l'œuvre, ni causer un préjudice injustifié aux intérêts des titulaires de droits. La directive DAMUN semble se positionner implicitement vis-à-vis de l’article 3 vers une absence de préjudice. Or, qu’en est-il de l’article 4 et des IA génératives ? L’exception de TDM au sein des IA génératives ne porte-t-elle pas atteinte à l’exploitation normale de l'œuvre et ne cause-t-elle pas un préjudice injustifié aux auteurs ?

(1) Directive 2001/29/CE du Parlement européen et du Conseil du 22 mai 2001 sur l'harmonisation de certains aspects du droit d'auteur et des droits voisins dans la société de l'information, art. 2.
(2) Directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d'auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE, art. 2 - 2.
(3) Directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d'auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE, article 3 - 1.
(4) Directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d'auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE, art. 4 -1. 

Mots clés : creation enjeux juridiques ia generatives iag input intelligence artificielle replay tdm text and data mining

 Informations