
RETROUVEZ CET ARTICLE ET PLUS ENCORE DANS NOTRE MAGAZINE : IA : les nouveaux défis de l’édition scientifique
Au sommaire :
- Les usages de l’IA dans le monde de l’édition scientifique
- Sébastien Perrin, directeur de la Bibliothèque de l’École des Mines de Paris-PSL : "face à l’IA, je plaide pour une expertise documentaire"
- L’IA en BU : enjeux éthiques et juridiques
- IA et fraude scientifique : poison ou remède ?
- IA et recherche : les bibliothèques et centres de documentation réaffirment leur rôle
- Avec SophIA, Cairn.info mise sur l’IA pour améliorer la découvrabilité
Droit d’auteur, intégrité scientifique, biais cognitifs et techniques… C’est peu dire que l’IA bouleverse le monde de l’édition scientifique. Comme le faisait remarquer une intervenante lors d’une journée d’étude organisée par la plateforme de dépôt de publications scientifiques HAL en 2024, "l’usage de méthodes puissantes et opaques d’intelligence artificielle bouscule les archives et les bibliothèques et les appelle à se questionner sur leur rôle en matière de biais d’indexation et de falsification".
Les bibliothécaires et les archivistes ne sont d’ailleurs pas les seuls à devoir négocier le virage de l’IA. De leur côté, les éditeurs scientifiques et les fournisseurs de SIGB recourent à l’intelligence artificielle pour accroître les performances de leurs outils, en particulier leurs moteurs de recherche.
Lire aussi : Rechercher et traiter l’information avec les IA
"Au sein de l’Université Bordeaux Montaigne, nous avons ainsi pu tester Primo Research Assistant, le moteur de recherche augmenté par l’IA de notre fournisseur de SIGB Ex Libris, et les tests que nous avons réalisés ne sont pas très satisfaisants", explique Julien Baudry (Service commun documentation). "Le principal problème concerne le périmètre sur lequel le moteur de recherche entraîne son IA et à partir duquel des données sont générées : ce périmètre est en effet assez réduit et exclut un certain nombre de ressources payantes, comme JSTOR. À nos yeux, ne pas interroger l’ensemble des ressources constitue une faiblesse de l’outil."
Ces clauses qui contreviennent à l’ordonnance TDM
Face aux contrats qu’elles signent avec les éditeurs, les bibliothèques sont dans l’expectative : les usagers peuvent-ils, par exemple, procéder à une fouille de texte sur les corpus mis à leur disposition ? Dans un premier temps, c’est une approche libérale qui a prévalu, avec l’ordonnance TDM (Text and Data Mining ou fouille de textes et de données) du 24 novembre 2021. Ce texte consacre en effet une exception importante au droit d’auteur pour l’utilisation des œuvres à des fins de fouille de textes et de données. Cette exception bénéficie notamment aux établissements patrimoniaux (bibliothèques, musées, archives) et aux organismes de recherche.
"Il y a quatre ans, nous avons pourtant vu apparaître des clauses qui limitent les possibilités de fouiller des textes fournis par les éditeurs aux bibliothèques", déplore Julien Baudry. "Ces clauses contreviennent à l’ordonnance TDM qui est, pour le moment, la base légale sur laquelle s’appuient les spécialistes et entreprises qui développent des systèmes d’IA". Selon lui, les BU doivent s’assurer de la possibilité de réaliser des fouilles de texte dans ces ressources numériques sous droits sans barrière, "conformément à la loi", précise-t-il.
Lire aussi : Sandrine Gropp : les BU ont besoin d'une "stratégie documentaire nationale ambitieuse"
Les BU sont par ailleurs bien conscientes des risques liés aux biais algorithmiques. L’Université Bordeaux Montaigne mène une réflexion critique vis-à-vis de ces outils et une personne se consacre spécifiquement à cette question : test des outils, publication de rapports, production de synthèse… Cette logique de prudence conduit l’institution à ne pas rejeter l’IA en bloc et à communiquer aux étudiants un esprit critique. Le SCD a par ailleurs organisé plusieurs ateliers ouverts à l’ensemble de la communauté éducative.
Aux yeux de Julien Baudry, un autre enjeu éthique doit être soulevé : celui du droit d’auteur. Selon lui, tout l’enjeu réside dans le fait de savoir s’il est légal ou non d’entraîner des IA sur des données sous droits d’auteur. "Il existe en tous cas une base légale, mais on voit très clairement qu’il y a une bataille juridique autour de ce que permet le droit d’auteur, et de la possibilité de rendre illégales des productions faites avec l’IA". D’après lui, une autre question se pose : les difficultés juridiques peuvent-elles réellement freiner le développement des systèmes d’IA ? "Il y a ici un nœud à résoudre", conclut-il.









