Droit d’auteur, intelligence artificielle et production documentaire

Les réflexions sur le droit d’auteur face à l’intelligence artificielle se multiplient, les premiers jalons législatifs sont déjà posés et d’autres projets de textes - européens ou français - émergent. Tout comme une confusion latente qui menace nos métiers…

Découvrez toutes les newsletters thématiques gratuites d'Archimag dédiées aux professionnels de la transformation numérique, des bibliothèques, des archives, de la veille et de la documentation.

Dans les débats actuels, il nous semble apparaître une grave confusion bien connue de nos professions, sur laquelle notamment les éditeurs de presse et le CFC font leurs choux gras depuis près de quarante ans (le CFC est né en 1983, même s’il a changé ses statuts en 1995 pour devenir conforme à la loi sur la reproduction par reprographie). C’est cette confusion latente que nous souhaitons dénoncer ici en ce qu’elle menace également nos métiers. Nous repartirons de certaines pratiques documentaires pour étayer notre propos.

Rappel : un agencement d’idées et d’informations est licite

En matière de texte, rappelons que la propriété de l’auteur porte exclusivement sur l’agencement des idées et des informations qu’il souhaite communiquer. Cet apport personnel de l’auteur est défini dans le Code de la propriété intellectuelle (CPI) comme "le choix ou la disposition de matières" (article L.112-3, al. 1er). Autrement dit, la propriété de l’auteur porte sur le choix des mots qu’il agence en phrases, paragraphes, chapitres…

Mais les idées et les informations portées par cet apport personnel que constitue son texte ne sont pas protégées (nous l’expliquons souvent dans nos publications et formations), puisqu’idées et informations sont la matière première des professions de l’information-documentation.

Lorsqu’un professionnel se livre à la rédaction du résumé documentaire d’un article de revue - ou de toute autre œuvre -, il est libre de le faire au regard du droit d’auteur, puisqu’il ne reprend que les idées et informations qu’il a identifiées dans le texte de l’auteur, mais en rien le texte qui lui seul appartient à l’auteur.

Si d’aventure, il trouve une formulation de l’auteur qui lui paraît si précise qu’il lui paraît utile de la reproduire in extenso, il le fait licitement dans le cadre de l’exception de courte citation (article L. 122-5 3°, a CPI).

Ce qui est licite pour le résumé d’un texte l’est a fortiori pour le résumé d’un ensemble de textes, qu’on nomme "synthèse documentaire" ou "synthèse de presse", selon les sources utilisées.

Intelligence artificielle et pratique documentaire, même combat ?

Nous posons cette question avec un clin d’œil : quelques esprits chagrins n’hésiteront pas à affirmer que l’intelligence artificielle va voler le travail des professionnels de l’information-documentation (refrain déjà entendu à la naissance de chaque nouvelle technologie, notamment les bases de données, l’internet et ses moteurs de recherche…).

Si la problématique de l’IA émerge aujourd’hui fortement, on la connaît déjà depuis des années. Des traces d’IA se trouvent dans des logiciels bureautiques depuis longtemps : la fonction de résumé automatique des anciennes versions du logiciel Microsoft Word ; le correcteur orthographique et grammatical d’un traitement de texte ; les outils de traduction automatique, etc.

Mais c’est évidemment la fonction de "synthèse" - notamment avec ChatGPT - qui a ému le monde entier, avec la croyance selon laquelle les logiciels deviendraient intelligents et donc créatifs. En réalité, un logiciel du type GPT d’OpenAI (qui sous-tend ChatGPT) pratique tout simplement la "fouille de textes" (pour reprendre l’expression consacrée par la Directive EU 2019/790, aujourd’hui transposée notamment aux articles L.122-5 10° et L.122-5-3 CPI), les analyse et en ressort un texte de synthèse, au besoin thématique.

Si ces outils sont dits "intelligents", c’est qu’au-delà des mots, ils identifient les concepts qui sont portés par les textes : ils sont donc capables d’identifier les idées et informations mises en œuvre dans ces textes et de restituer une synthèse structurée autour de ces concepts.

En d’autres termes, ces logiciels sont entraînés à fonctionner comme des professionnels de l’information-documentation. Et plutôt que de les considérer comme des rivaux, autant les accueillir favorablement, tout comme les traducteurs voient leur travail accéléré par les outils de traduction automatique, même si en dernière analyse, ils restent maîtres - et pleinement auteurs - de leurs traductions.

Quelques fantasmes législatifs

Dans le long article L.122-5-3 développant l’exception de fouille de texte (qui fonde également le travail des moteurs de recherche sur internet), le point III prévoit une réserve : "sauf si l’auteur s’y est opposé de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne".

Pourtant, le principe de toute exception au droit d’auteur est qu’elle joue dès la publication de l’œuvre. Le chapeau de l’article L.122-5, qui porte toutes les exceptions au droit d’auteur, pose le principe : "Lorsque l’œuvre a été divulguée, l’auteur ne peut interdire". Suivent alors les exceptions instituées en droit français - dont celle de la fouille de textes.

Si cette réserve - qui semble appartenir à la seule transposition française de la directive - est présente, c’est en vertu d’une confusion qui ferait que l’auteur d’un texte pourrait s’opposer à ce que des outils automatisés puissent fouiller son œuvre dans le seul but de sortir "notamment des constantes, des tendances et des corrélations" (L.122-5-3 I) ou encore, d’identifier les thématiques, les idées et informations.

Simple question : de quel droit ? Nous l’avons déjà précisé, l’auteur n’est propriétaire que de son texte, autrement dit de ses phrases et de son style. Si cette prérogative devait être laissée à l’auteur, on obérerait sérieusement la libre circulation des idées et des informations, un des droits de l’homme essentiel.

Mais surtout, cette disposition nous ramène 20 ans en arrière, à l’époque où la Charte du Geste (groupement des éditeurs d’information en ligne) prétendait que "le résumé d’un article est soumis à l’autorisation préalable de l’auteur ou de son ayant droit".

En d’autres termes, si ce "pouvoir de dire non" des auteurs était pris au pied de la lettre, cela validerait les fantasmes les plus fous des éditeurs de presse - soucieux de tout faire payer -, et surtout mettrait hors-la-loi la rédaction des résumés et synthèses documentaires, limitant singulièrement les fonctions d’information-documentation.

Et l’amendement à la proposition de règlement européen dénommé "AI Act" (lire notre article sur les enjeux juridiques de la collecte de données par les IA génératives), prolonge cette confusion en évoquant les "données d’entraînement protégées par la législation sur le droit d’auteur". C’est en effet confondre "œuvre d’auteur" et "donnée"…

Une proposition de loi qui enfonce le clou

Le 12 septembre dernier, des députés ont déposé une proposition de loi "visant à encadrer l’intelligence artificielle par le droit d’auteur". La confusion que nous dénonçons transparaît dès l’article premier de ce texte, qui voudrait insérer à l’article L.131-3 CPI un nouvel alinéa : "l’intégration par un logiciel d’intelligence artificielle d’œuvres de l’esprit protégées par le droit d’auteur dans son système et a fortiori leur exploitation est soumise aux dispositions générales du présent code et donc à autorisation des auteurs ou ayants droit".

L’article 2 insérerait à l’article L.321-2 le principe : "lorsque l’œuvre est créée par une intelligence artificielle sans intervention humaine directe, les seuls titulaires des droits sont les auteurs ou ayants droit des œuvres qui ont permis de concevoir ladite œuvre artificielle".

Là encore, aucune distinction sur le fait de savoir si ce sont les phrases mises en forme par l’auteur qui sont reprises, ou simplement les idées et informations que son œuvre porte. Et nous n’évoquerons pas, dans cette proposition, le énième recours à une société de gestion collective de droit d’auteur (type CFC) chargée de percevoir collectivement les droits desdits auteurs… pour mieux ne pas les rémunérer.

Pour ne pas conclure

On comprend dès lors mieux la raison pour laquelle nous affirmions ci-dessus : "IA et pratique documentaire, même combat". Si les législateurs, trop souvent sous l’influence des éditeurs, s’ingénient à ajouter des couches de droits à payer qui au final rémunèrent plutôt les éditeurs, mais quasiment jamais les auteurs-personnes physiques, ils finiront par bloquer la circulation des idées et des informations. Qui sont - ne l’oublions jamais - la matière première des professions de l’information-documentation.

Sources juridiques

Code de la propriété intellectuelle :

Critères de protection d’une œuvre d’auteur : notamment article L.112-3.
Exception de courte citation : article L. 122-5 3°, a.
Pratique de la fouille de textes : article L. 122-5 10° complété par l’article L.122-5-3

Directive (UE) 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE : articles 2, 3 et 4.

Textes cités par Charles Bouffier et Victoire Danès : Les enjeux juridiques de la collecte de données par les IA génératives

Didier Frochot
[www.les-infostratèges.com]

Droit d’auteur, intelligence artificielle et production documentaire

droit-auteur-intelligence-artificielle-politique-documentaire.jpg

Rappel : un agencement d’idées et d’informations est licite

Intelligence artificielle et pratique documentaire, même combat ?

Quelques fantasmes législatifs

Une proposition de loi qui enfonce le clou

Pour ne pas conclure

Sources juridiques

Les derniers mags :

Les derniers guides :

Calico : IA générative locale : vers une gestion de l’information plus intelligente et souveraine

Archimag : Stop au vrac numérique !

Archimag : Donnée produit : gouverner, enrichir, diffuser et sécuriser un actif devenu stratégique

Coexel : Libérez le potentiel de la Veille avec l’IA Générative - Edition 2026

Archimag : Facturation électronique : le plan d’action opérationnel pour septembre 2026

Bibliotheca : Révolutionner la bibliothèque : vers un tiers-lieu plus ouvert, accessible et autonome