Article réservé aux abonnés Archimag.com

Le web de données, planche de salut des bibliothèques sur le web

  • web_bib.jpg

    L’une des promesses du web de don- nées appliqué aux bibliothèques réside dans le désenclavement des données stockées dans leurs catalogues. (Freepik/Jcomb)
  • Victimes d’un mauvais référencement, les bibliothèques peinent à exister sur le web. Mais elles s’organisent pour donner une meilleure visibilité à leurs collections en ligne. En France, le site Data.bnf.fr est la figure de proue de cette bataille pour le référencement alors que le programme Bibframe se poursuit à l’étranger.

    Comment les bibliothèques peuvent-elles exister sur le web ? À cette question, Laurence Engel, la présidente de la Bibliothèque nationale de France, apporte un début de réponse : « La BNF mène une bataille pour le référencement », nous déclarait-elle l’an dernier ; « c’est un enjeu majeur. Il faut capter l’attention de l’internaute. Cela passe par l’adaptation permanente de nos outils pour être visible sur le web ».

    Pour accroître cette visibilité, la BNF peut compter sur Data.bnf.fr. Ce site rassemble des données issues de plusieurs catalogues de la BNF (Catalogue général, Archives et manuscrits…), de plusieurs types de contenu (Gallica, archives du web…) ou des listes de référence (bibliographies thématiques, signets). Ces données peuvent également être reliées à des ressources extérieures (autorités du Sudoc, par exemple) en s’appuyant sur les outils du web sémantique.

    Lancé en 2011, Data.bnf.fr regorge donc de données qualifiées. « Ces données permettent notamment de décrire et identifier les documents conservés à la BNF. Le site permet de rassembler autour de ses pages auteur, œuvre, thème, date et lieu des ressources de la Bibliothèque nationale de France, ainsi que des ressources extérieures », précise-t-on à Data.gouv.fr.

    Décloisonner l’information

    Pour y parvenir, Data.bnf.fr embarque une technologie : « Le web de données permet de décloisonner l’information sur le web en créant du lien entre des données qui sont similaires ou qui sont en relation à l’intérieur de bases de données stockées sur différents serveurs », explique Emmanuelle Bermès, adjointe scientifique et technique au directeur des services et des réseaux à la BNF.

    Data.bnf.fr a donc été clairement conçu pour répondre aux besoins et aux pratiques numériques des usagers. Il s’inscrit dans une logique d’open data et repose sur le respect du web sémantique. Les données qui décrivent les collections de la BNF sont donc libres et réutilisables. Elles ont par exemple permis de développer l’outil Gallicarte grâce auquel on peut visualiser sur une carte les documents de Gallica.

    Le tour du monde numérique en 80 secondes

    Concrètement, les catalogues des bibliothèques sont constitués de données structurées de grande qualité. Malheureusement pour elles, leur mauvais référencement les plonge dans les abysses des moteurs de recherche. Résultat : le travail des bibliothécaires reste dans l’ombre alors qu’il pourrait apporter une valeur ajoutée aux internautes. « Si on veut exister au regard des lecteurs qui fréquentent les bibliothèques, et plus encore au regard de ceux qui ne les fréquentent pas encore, il est extrêmement important d’être visible sur le web. Et pour être visible, il faut adopter les technologies du web », estime Emmanuelle Bermès.

    L’une des promesses du web de données appliqué aux bibliothèques réside dans le désenclavement des données stockées dans leurs catalogues. Ces données seront en effet reliées à d’autres données provenant de fonds d’archives ou de documentation produites par les musées. Car, pour de multiples raisons, ces données ne sont pas toutes produites dans les mêmes formats. Une fois décloisonnées, elles sont en mesure de communiquer entre elles. Ainsi, des ouvrages consacrés à Robespierre pourront être liés à des archives autour de Robespierre.

    Mieux : il est possible d’accéder à tout le patrimoine documentaire que la BNF possède autour d’un thème, d’un lieu ou d’un personnage. Prenons l’exemple de Jules Verne. Data.bnf.fr propose une carte interactive qui recense l’ensemble des ressources de la Bibliothèque nationale de France consacrées à l’auteur de « L’île mystérieuse ». Ses écrits sont mis à disposition via Gallica (la bibliothèque numérique de la BNF) ; ses lettres et manuscrits sont recensés via le catalogue « Archives et manuscrits » de la BNF. Data.bnf.fr inventorie également les images, les spectacles et les expositions virtuelles consacrés à Jules Verne. Encore plus fort, la plateforme propose des liens vers des ressources extérieures à la BNF : bibliothèques étrangères ou Wikipedia, par exemple. Bref, le tour du monde numérique en 80 secondes !

    Interopérabilité des données de l’information scientifique et technique

    Autre institution française engagée dans le web de données, l’Agence bibliographique de l’enseignement supérieur (Abes) fait figure de précurseur. Dès 2007, elle engageait une réflexion sur la meilleure façon d’améliorer le référencement des métadonnées par les moteurs de recherche. Un an plus tard, le catalogue en ligne Calames voyait le jour : « Nous avons commencé à distiller, l’air de rien, des métadonnées en RDF [resource description framework] sous sa forme encore la plus répandue : du RDFa, c’est-à-dire des triplets encapsulés dans des balises cachées en code HTML », se souvient Michael Jeulin, expert métadonnées au sein de l’Abes.

    Au mois de mai 2016, l’Abes mettait en ligne une base de données RDF (Resource Description Framework (RDF) est un modèle destiné à décrire de façon formelle les ressources web et leurs métadonnées) interrogeable en SparQL (SparQL est un langage de requête et un protocole qui permet de rechercher, d’ajouter, de modifier ou de supprimer des données RDF disponibles à travers internet) : « Il ne s’agit pas d’un nouveau service, mais d’un démonstrateur, défense et illustration pédagogique d’une approche “web sémantique” de l’interopérabilité des données de l’information scientifique et technique ».

    Bibframe pour remplacer le Marc 21

    Les bibliothécaires français ne sont pas les seuls à imaginer le web de données appliqué aux bibliothèques. En 2011, le programme Bibframe était lancé au sein de la Bibliothèque du Congrès (États-Unis). Objectif : remplacer le format Marc 21 (longtemps utilisé lors de l’informatisation des bibliothèques dans les années 1970) par un modèle de données correspondant aux enjeux contemporains de l’accès aux connaissances. À coup de développements et d’expérimentations, Bibframe a pour objectif de ne pas seulement décrire les ressources, mais de créer des liens avec d’autres ressources. Le programme est suivi de près par de nombreux catalogueurs dans le monde.

    « Toutefois, malgré ces avantages, plusieurs obstacles restent encore à étudier », constate Julie Toussaint (Bibframe, le futur des bibliothèques ?) ; « Bibframe étant un modèle encore en construction, de multiples possibilités sont envisageables. Cependant, certaines d’entres elles ne semblent pas considérer suffisamment encore les enjeux financiers, humains ou encore légaux ». Sans oublier le coût (en formation) et en charge de travail qui pèserait sur les bibliothécaires pour se mettre à niveau.

    Le prix à payer pour exister sur le web.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Archimag-320
    Nouvelle stratégie, réforme, réorganisation, choix économique, digitalisation… Les raisons d’une mutualisation ou d’une fusion de centres de documentation peuvent avoir diverses origines.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Le chiffre du jour
    des bibliothèques proposant des ressources numériques ont constaté depuis le début du confinement une augmentation des usages de leurs ressources en ligne, selon une enquête flash menée par le ministère de la Culture fin mars 2020.
    Recevez l'essentiel de l'actu !
    Publicité

    banniere-archimag_2_0.gif

    doc 2020.PNG

    banniere GP52 web.png