
RETROUVEZ CET ARTICLE ET PLUS ENCORE DANS NOTRE MAGAZINE : IA : les nouveaux défis de l’édition scientifique
Au sommaire :
- Les usages de l’IA dans le monde de l’édition scientifique
- Sébastien Perrin, directeur de la Bibliothèque de l’École des Mines de Paris-PSL : "face à l’IA, je plaide pour une expertise documentaire"
- L’IA en BU : enjeux éthiques et juridiques
- IA et fraude scientifique : poison ou remède ?
- IA et recherche : les bibliothèques et centres de documentation réaffirment leur rôle
- Avec SophIA, Cairn.info mise sur l’IA pour améliorer la découvrabilité
Quels sont les impacts de l’IA dans le domaine de l’édition scientifique ?
Pour les bibliothèques universitaires et Couperin, l’IA générative a surgi de façon brutale. Son premier impact s’est manifesté peu après le lancement de ChatGPT, sous la forme de nouvelles licences, que les éditeurs nous ont demandé de signer pour se protéger des risques de pillage, et qui interdisaient l’usage de l’IA sur les corpus acquis. Ces clauses ont été soumises à toutes les bibliothèques en Europe et en Amérique du Nord et depuis largement amendées.
Lire aussi : Rechercher et traiter l’information avec les IA
Pour ce qui est plus largement de l’écosystème de l’édition scientifique, l’IA générative repose sur une technique stochastique et aléatoire empêchant la reproductibilité des résultats et qui a de plus tendance à invisibiliser les sources. Ce manque de transparence pose de sérieux problèmes dans un cadre académique et justifie la volonté des établissements de mettre en place des chartes d’utilisation de l’IA.
Les biais cognitifs, qu’ils soient linguistiques ou disciplinaires, sont-ils problématiques ?
Oui, et j’ajoute les biais documentaires, car nous ignorons les choix de conception documentaires et les sources qui alimentent les IA. Nous savons qu’il s’agit de sites internet, pas forcément de ressources académiques ou de leur provenance. Nous connaissons encore moins la façon dont ces outils recherchent et sélectionnent ces sources.
Il y a un besoin de transparence : quelles sont les sources utilisées ? Y a-t-il une intégration de documents en open science en complément du corpus initial, ou les IA ont-elles accès à certains contenus sous droit d’autres éditeurs ? Y a-t-il un retraitement des données pour améliorer la qualité des outils ? Quels ont été les choix de conception qui ont présidé à la création des textes générés avec les prompts ? Si par exemple, une quinzaine d’articles sont retenus pour générer le texte de réponse, cela s’appuie-t-il sur le ranking des revues ou favorise-t-il la production de l’éditeur ?
Le consortium Couperin a développé un partenariat avec le gf2i (groupement français des industries de l’information) pour répondre à ces enjeux et ces questions s’inscrivent dans le mouvement qui a été initié par le Parlement et le Conseil européens avec l’AI Act de 2024.
Les éditeurs d’informations scientifiques intègrent-ils de l’IA dans leurs outils ?
Tout à fait, notamment avec l’évolution des moteurs de recherche, mais leurs choix de développement sont très variables. On note l’apparition d’outils génératifs répondant à des cas d’usage très différents. Certains outils utilisent l’IA générative pour réaliser des revues de littérature sur des corpus massifs. D’autres recourent à l’IA pour aider simplement à la rédaction d’un résumé sur un sujet : il s’agit de chercher des textes dans la base de l’éditeur, d’en reproduire des extraits et de les relier entre eux par une couche générative. On appelle également "IA" des moteurs de recherche sémantique qui utilisent uniquement les bonnes vieilles techniques du web. Nous voyons aussi apparaître des fonctionnalités d'aide à la publication et à la rédaction.
Lire aussi : IA génératives : mode d’emploi pour les métiers de l’information
C’est pourquoi je plaide pour une expertise documentaire en mesure de traiter ces sujets, car les fournisseurs sont, par exemple, dans l’incapacité technique de nous fournir le pourcentage d’hallucinations ou les conditions dans lesquelles elles peuvent apparaître. Ces outils suscitent beaucoup d’espoirs de la part des chercheurs et des étudiants, mais le flou qui entoure leur conception risque de créer une énorme déception.
L’IA est-elle un moyen pour les éditeurs de créer une chaîne de fonctionnalités pour imposer un modèle économique aux BU ?
La question peut se poser en effet. Nous constatons bien l’intégration, par certains éditeurs, de l’ensemble des étapes de la chaîne de publication grâce à cette technologie. À partir du moment où une aide à la rédaction de papiers scientifiques est couplée à un système de synthèse d’un article, avec ensuite la possibilité de faire des requêtes dans des bases documentaires pour une revue de littérature, la question de la stratégie de commercialisation se pose et ne passe plus forcément par les bibliothèques universitaires.
Mais il est important de rappeler qu’il s’agit actuellement, pour la plupart des éditeurs, d’améliorer avant tout leur moteur de recherche traditionnel et de le rendre plus puissant.
L’IA facilite-t-elle la transition vers la science ouverte ?
Cette question fait partie des dossiers qu’il faudra instruire en 2026. Les chercheurs sont tout à fait prêts à concilier IA et open science, mais ils ne sont pas favorables à ce que leurs produits soient utilisés par les plateformes d’IA pour les monétiser.









