Article réservé aux abonnés Archimag.com

Droit d’auteur, intelligence artificielle et production documentaire

  • droit-auteur-intelligence-artificielle-politique-documentaire.jpg

    droit-auteur-intelligence-artificielle-propriete-intellectuelle
    "Un logiciel du type GPT d’OpenAI (qui sous-tend ChatGPT) pratique tout simplement la "fouille de textes", il les analyse et en ressort un texte de synthèse, au besoin thématique", explique Didier Frochot.
  • Les réflexions sur le droit d’auteur face à l’intelligence artificielle se multiplient, les premiers jalons législatifs sont déjà posés et d’autres projets de textes - européens ou français - émergent. Tout comme une confusion latente qui menace nos métiers…

    mail Découvrez toutes les newsletters thématiques gratuites d'Archimag dédiées aux professionnels de la transformation numérique, des bibliothèques, des archives, de la veille et de la documentation.

    Dans les débats actuels, il nous semble apparaître une grave confusion bien connue de nos professions, sur laquelle notamment les éditeurs de presse et le CFC font leurs choux gras depuis près de quarante ans (le CFC est né en 1983, même s’il a changé ses statuts en 1995 pour devenir conforme à la loi sur la reproduction par reprographie). C’est cette confusion latente que nous souhaitons dénoncer ici en ce qu’elle menace également nos métiers. Nous repartirons de certaines pratiques documentaires pour étayer notre propos.

    Lire aussi : Droit à la copie : rémunération des auteurs et CFC

    Rappel : un agencement d’idées et d’informations est licite

    En matière de texte, rappelons que la propriété de l’auteur porte exclusivement sur l’agencement des idées et des informations qu’il souhaite communiquer. Cet apport personnel de l’auteur est défini dans le Code de la propriété intellectuelle (CPI) comme "le choix ou la disposition de matières" (article L.112-3, al. 1er). Autrement dit, la propriété de l’auteur porte sur le choix des mots qu’il agence en phrases, paragraphes, chapitres…

    Mais les idées et les informations portées par cet apport personnel que constitue son texte ne sont pas protégées (nous l’expliquons souvent dans nos publications et formations), puisqu’idées et informations sont la matière première des professions de l’information-documentation.

    Lorsqu’un professionnel se livre à la rédaction du résumé documentaire d’un article de revue - ou de toute autre œuvre -, il est libre de le faire au regard du droit d’auteur, puisqu’il ne reprend que les idées et informations qu’il a identifiées dans le texte de l’auteur, mais en rien le texte qui lui seul appartient à l’auteur.

    Si d’aventure, il trouve une formulation de l’auteur qui lui paraît si précise qu’il lui paraît utile de la reproduire in extenso, il le fait licitement dans le cadre de l’exception de courte citation (article L. 122-5 3°, a CPI).

    Ce qui est licite pour le résumé d’un texte l’est a fortiori pour le résumé d’un ensemble de textes, qu’on nomme "synthèse documentaire" ou "synthèse de presse", selon les sources utilisées.

    Intelligence artificielle et pratique documentaire, même combat ?

    Nous posons cette question avec un clin d’œil : quelques esprits chagrins n’hésiteront pas à affirmer que l’intelligence artificielle va voler le travail des professionnels de l’information-documentation (refrain déjà entendu à la naissance de chaque nouvelle technologie, notamment les bases de données, l’internet et ses moteurs de recherche…).

    Lire aussi : Propriété intellectuelle, RGPD... Les prestations de communication face au droit

    Si la problématique de l’IA émerge aujourd’hui fortement, on la connaît déjà depuis des années. Des traces d’IA se trouvent dans des logiciels bureautiques depuis longtemps : la fonction de résumé automatique des anciennes versions du logiciel Microsoft Word ; le correcteur orthographique et grammatical d’un traitement de texte ; les outils de traduction automatique, etc.

    Mais c’est évidemment la fonction de "synthèse" - notamment avec ChatGPT - qui a ému le monde entier, avec la croyance selon laquelle les logiciels deviendraient intelligents et donc créatifs. En réalité, un logiciel du type GPT d’OpenAI (qui sous-tend ChatGPT) pratique tout simplement la "fouille de textes" (pour reprendre l’expression consacrée par la Directive EU 2019/790, aujourd’hui transposée notamment aux articles L.122-5 10° et L.122-5-3 CPI), les analyse et en ressort un texte de synthèse, au besoin thématique.

    Si ces outils sont dits "intelligents", c’est qu’au-delà des mots, ils identifient les concepts qui sont portés par les textes : ils sont donc capables d’identifier les idées et informations mises en œuvre dans ces textes et de restituer une synthèse structurée autour de ces concepts.

    En d’autres termes, ces logiciels sont entraînés à fonctionner comme des professionnels de l’information-documentation. Et plutôt que de les considérer comme des rivaux, autant les accueillir favorablement, tout comme les traducteurs voient leur travail accéléré par les outils de traduction automatique, même si en dernière analyse, ils restent maîtres - et pleinement auteurs - de leurs traductions.

    Quelques fantasmes législatifs

    Dans le long article L.122-5-3 développant l’exception de fouille de texte (qui fonde également le travail des moteurs de recherche sur internet), le point III prévoit une réserve : "sauf si l’auteur s’y est opposé de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne".

    Lire aussi : Réaliser ses missions de veille dans le respect du RGPD

    Pourtant, le principe de toute exception au droit d’auteur est qu’elle joue dès la publication de l’œuvre. Le chapeau de l’article L.122-5, qui porte toutes les exceptions au droit d’auteur, pose le principe : "Lorsque l’œuvre a été divulguée, l’auteur ne peut interdire". Suivent alors les exceptions instituées en droit français - dont celle de la fouille de textes.

    Si cette réserve - qui semble appartenir à la seule transposition française de la directive - est présente, c’est en vertu d’une confusion qui ferait que l’auteur d’un texte pourrait s’opposer à ce que des outils automatisés puissent fouiller son œuvre dans le seul but de sortir "notamment des constantes, des tendances et des corrélations" (L.122-5-3 I) ou encore, d’identifier les thématiques, les idées et informations.

    Simple question : de quel droit ? Nous l’avons déjà précisé, l’auteur n’est propriétaire que de son texte, autrement dit de ses phrases et de son style. Si cette prérogative devait être laissée à l’auteur, on obérerait sérieusement la libre circulation des idées et des informations, un des droits de l’homme essentiel.

    Mais surtout, cette disposition nous ramène 20 ans en arrière, à l’époque où la Charte du Geste (groupement des éditeurs d’information en ligne) prétendait que "le résumé d’un article est soumis à l’autorisation préalable de l’auteur ou de son ayant droit".

    En d’autres termes, si ce "pouvoir de dire non" des auteurs était pris au pied de la lettre, cela validerait les fantasmes les plus fous des éditeurs de presse - soucieux de tout faire payer -, et surtout mettrait hors-la-loi la rédaction des résumés et synthèses documentaires, limitant singulièrement les fonctions d’information-documentation.

    Lire aussi : La gestion des droits d'auteur des salariés

    Et l’amendement à la proposition de règlement européen dénommé "AI Act" (lire notre article sur les enjeux juridiques de la collecte de données par les IA génératives), prolonge cette confusion en évoquant les "données d’entraînement protégées par la législation sur le droit d’auteur". C’est en effet confondre "œuvre d’auteur" et "donnée"…

    Une proposition de loi qui enfonce le clou

    Le 12 septembre dernier, des députés ont déposé une proposition de loi "visant à encadrer l’intelligence artificielle par le droit d’auteur". La confusion que nous dénonçons transparaît dès l’article premier de ce texte, qui voudrait insérer à l’article L.131-3 CPI un nouvel alinéa : "l’intégration par un logiciel d’intelligence artificielle d’œuvres de l’esprit protégées par le droit d’auteur dans son système et a fortiori leur exploitation est soumise aux dispositions générales du présent code et donc à autorisation des auteurs ou ayants droit".

    L’article 2 insérerait à l’article L.321-2 le principe : "lorsque l’œuvre est créée par une intelligence artificielle sans intervention humaine directe, les seuls titulaires des droits sont les auteurs ou ayants droit des œuvres qui ont permis de concevoir ladite œuvre artificielle".

    Lire aussi : Veille sur les réseaux sociaux et droits d’auteur

    Là encore, aucune distinction sur le fait de savoir si ce sont les phrases mises en forme par l’auteur qui sont reprises, ou simplement les idées et informations que son œuvre porte. Et nous n’évoquerons pas, dans cette proposition, le énième recours à une société de gestion collective de droit d’auteur (type CFC) chargée de percevoir collectivement les droits desdits auteurs… pour mieux ne pas les rémunérer.

    Pour ne pas conclure

    On comprend dès lors mieux la raison pour laquelle nous affirmions ci-dessus : "IA et pratique documentaire, même combat". Si les législateurs, trop souvent sous l’influence des éditeurs, s’ingénient à ajouter des couches de droits à payer qui au final rémunèrent plutôt les éditeurs, mais quasiment jamais les auteurs-personnes physiques, ils finiront par bloquer la circulation des idées et des informations. Qui sont - ne l’oublions jamais - la matière première des professions de l’information-documentation.

    Sources juridiques

    • Code de la propriété intellectuelle :

    Critères de protection d’une œuvre d’auteur : notamment article L.112-3.
    Exception de courte citation : article L. 122-5 3°, a.
    Pratique de la fouille de textes : article L. 122-5 10° complété par l’article L.122-5-3

    • Directive (UE) 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE : articles 2, 3 et 4.

    Didier Frochot
    [www.les-infostratèges.com]

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    prevenir-guerir-infobésité
    Omniprésence de l’information, surabondance d’applications et d’outils, avalanche de données… Pris dans ces flux numériques ininterrompus, sommes-nous toutes et tous devenus infobèses? Les symptômes de cette maladie contemporaine permettent de poser un premier diagnostic : […] l’infobésité pose de sérieux défis aux organisations, aux individus, comme à la planète.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    Serda Formation Veille 2023