L’intelligence artificielle est partout, mais a-t-elle sa place dans les bibliothèques ? Qui plus est dans les bibliothèques universitaires ? C’est sur ce thème qu’ont planché plus de 500 professionnels du document lors du congrès annuel de l’ADBU (Association des directeurs et personnels de direction des bibliothèques universitaires et de la documentation) qui s’est tenu à Bordeaux au mois de septembre dernier.
>Lire aussi : L'IA, des opportunités de développement pour les bibliothèques
Le potentiel de l'IA en bibliothèque universitaire
« Les services que peut rendre l’IA en bibliothèque universitaire sont nombreux, même s’ils sont peu développés encore », estime Marc Martinez, président de l’ADBU : assistance aux usagers, accompagnement des chercheurs sur des corpus de données étendus, automatisation d’une partie des activités documentaires…
De fait, les BU gèrent un patrimoine documentaire qui fait figure de terrain d’expérimentation idéal pour les chercheurs en IA.
Qu’on en juge : les données bibliographiques, les corpus numérisés et les renseignements en ligne peuvent naturellement servir de champ d’application à l’intelligence artificielle.
199 volumes médiévaux indexés par l’IA
Exemple concret avec le projet européen de recherche Himanis portant sur 199 volumes manuscrits du Moyen-Âge (soit 83 320 pages numérisées) qui ont été « lus » et indexés grâce à l’intelligence artificielle.
« L’objectif était de créer une indexation profonde de ces corpus médiévaux », explique Dominique Stutzmann, chargé de recherche à l’Institut de recherche et d’histoire des textes-CNRS ; « ces corpus contiennent 60 % de mots en latin et sont rédigés en écriture cursive.
L’IA améliore les résultats de recherche grâce à un entraînement qui s’est déroulé en plusieurs étapes. La recherche en plein texte permet surtout de dresser un panorama plus complet, comprenant non seulement les attestations de mots, de leurs quasi-synonymes, mais aussi des absences dans des contextes où ils pourraient intervenir ».
>Lire aussi : Quand l'intelligence artificielle s'invite dans le traitement documentaire
Grâce à l’IA, ces 199 manuscrits médiévaux se dévoilent un peu plus. Outre l’indexation, l’intelligence artificielle est en mesure de participer à l’étude approfondie des documents, notamment la datation des manuscrits et la reconnaissance des mains du scribe.
L’apprentissage profond au service des bibliothèques
À la Bibliothèque nationale de France, l’IA est également mise à contribution pour la fouille d’images et l’amélioration de la recherche. Gallica, la bibliothèque numérique de la BNF, héberge de très nombreux documents iconographiques (photographies, dessins, estampes…).
Pour accéder à ce patrimoine, les internautes posent parfois des questions très précises :
« Je recherche des caricatures de Georges Clémenceau dans toutes les collections » ou bien « je veux compter le nombre de visages de femme présents sur la une de Paris-Match entre 1949 et 1959 »… Convenons-en, même le plus expérimenté des bibliothécaires aurait du mal à répondre à de telles requêtes !
>Lire aussi : Alerte : des robots bibliothécaires envahissent les bibliothèques de Singapour
Classifier les images par genre
« Des techniques d’apprentissage profond ainsi que l’API IIIF (l'International image interoperability framework est une API - interface de programme d’application - standardisée par le consortium IIIF ayant comme objectif de permettre la manipulation homogène d’images indépendamment de leurs localisations physiques et des établissements qui les hébergent) ont été utilisées pour entrer dans le document et le décrire.
L’intelligence artificielle permet de classifier les images par genres (dessin, graphe, photographie…) et de créer des métadonnées de qualité », explique Jean-Philippe Moreux, expert scientifique Gallica-BNF.
Ce nouvel outil de recherche iconographique, codéveloppé par Jean-Philippe Moreux et Guillaume Chiron (université de La Rochelle), a été baptisé GallicaPix.
>Lire aussi : La recherche d'information juridique augmentée par l'intelligence artificielle
Rendre accessibles les ressources iconographiques
« Sa création a pour point de départ le constat que les ressources iconographiques disponibles dans les imprimés, qu’il s’agisse de photographies, de dessins, de gravures ou de cartes, restent difficilement accessibles et encore peu valorisées. En tirant partie des progrès réalisés grâce aux techniques d’intelligence artificielle et en s’appuyant sur les collections numérisées avec OCR (reconnaissance optique de caractères) ou OLR (reconnaissance optique de la structuration des documents), il est pourtant possible de mieux identifier et exploiter cet immense réservoir d’images », soulignent les deux créateurs.
À ce jour, GallicaPix permet d’effectuer des recherches sur les collections d’imprimés numérisés (livre, revue, presse) du début du vingtième siècle.
Les limites de l'intelligence artificielle
Pour autant, l’IA n’est pas infaillible — loin de là — et montre parfois ses limites. La faute à des généralisations excessives réalisées à partir de jeux d’entraînement lacunaires.
Comme le font remarquer certains chercheurs, l’intelligence artificielle méconnaît le principe de neutralité axiologique cher à Max Weber. L’IA peut en effet amplifier les discriminations et les biais parce que celles-ci sont présentes dans les données qui entraînent les algorithmes et reflètent les comportements des gens.
>Lire aussi : Learning centers : un premier bilan pour ces bibliothèques universitaires du 21e siècle
Bibliothécaire ou biblIAthécaire ?
Au-delà de ses performances, l’irruption des technologies de l’IA dans les bibliothèques universitaires n’est pas sans conséquence sur le travail des bibliothécaires.
Même si un certain brouillard flotte encore sur ce qu’il adviendra, quelques pistes semblent se dégager : « Les BU devront mettre l’IA au service de leurs usagers et de leurs services, garantir la véracité des informations, traiter les problématiques éthiques et humaines que posent ces technologies », souligne Marc Martinez.
Pour David Aymonin, directeur de l’Abes (Agence bibliographique de l’enseignement supérieur), « l’intelligence artificielle suppose d’avoir de bonnes données, des algorithmes, des interfaces, des infrastructures, de la mémoire… et des compétences en informatique. Les professionnels de l’information-documentation peuvent se positionner sur la donnée et contribuer à la façon d’interroger l’IA ».
>Lire aussi : Quel avenir pour les bibliothécaires en bibliothèque universitaire ?
Montée en compétences
Faut-il alors parler de montée en compétences ? Invitée à livrer le témoignage d’une institution non universitaire, Estelle Caron, responsable du département documentation de l’Institut national de l’audiovisuel, estime que « la question de la formation des documentalistes de l’Ina est essentielle. Tout comme le travail d’éditorialisation des collections. L’intelligence artificielle nous a obligés à repenser notre offre de services aux chercheurs : interfaces d’accès, reconnaissance d’images, transcription… Ces nouveaux usages sont aussi l’occasion de nous interroger sur la fonction de médiation ».
Du côté des éditeurs et des prestataires présents au congrès de l’ADBU, on mise également sur l’IA. L’éditeur Emvista propose d’appliquer l’intelligence artificielle à l’analyse de textes, notamment la compréhension du langage naturel. Elsevier promet d’offrir des « services augmentés » aux bibliothécaires et les invite à apporter leurs compétences. Quant à la plateforme Cairn.info, elle va prochainement déployer un outil d’analyse du trafic pour mieux connaître les usages numériques en bibliothèque.