Article réservé aux abonnés Archimag.com

Transition bibliographique : la revanche des données ?

  • BNF Richelieu.jpg

    "Bibliothèques et librairies numériques ont atteint une masse critique et bruyante, dans laquelle il n’est plus possible de s’orienter correctement sans informations descriptives fiables et standardisées" (Pierre Metivier via VisualHunt / CC BY-NC)
  • Dans l’attente de la publication du code de catalogage français fondé sur RDA (Resource description and access/Ressources : description et accès), s’est ouverte une phase de transition bibliographique. Il s’agit d’adapter le catalogage à l’environnement web et numérique des bibliothèques. Explications, conséquences et perspectives avec Gildas Illien, directeur du département de l’information bibliographique et numérique de la BNF.

    L'informatisation et l’unification des catalogues des bibliothèques françaises ont connu leurs grandes batailles et leur âge d’or dans les décennies 1980-2000, fécondes en réalisations (comme le Sudoc, le Catalogue général de la BNF ou le Catalogue collectif de France) (voir les références en encadré, par ordre d’apparition dans le texte). À cette époque où internet était encore tout petit, l’accès aux ressources documentaires passait largement par les fourches des catalogues. On connaît la suite : les moteurs de recherche, l’édition numérique, les réseaux sociaux et les encyclopédies en ligne ont profondément modifié les usages et pris en grande partie le relais. C’est désormais le numérique qui questionne et mobilise les bibliothèques, reléguant souvent au second plan, voire tout au fond du décor, la question des catalogues.

    Pour beaucoup, l’enjeu principal du catalogage est de réussir à s’en débarrasser. Que ce soit par les voies de la dérivation de notices, de la production partagée en réseau ou de l’externalisation vers des outils de découverte où données et applicatifs sont liés et laissés à la main des fournisseurs, on cherche par tous les moyens à redéployer les effectifs et les compétences de catalogage vers d’autres fonctions.

    Le numérique nous rappelle au bon souvenir des catalogues

    Pour autant, arrivé à un certain niveau de maturité, le numérique nous rappelle aujourd’hui au bon souvenir des catalogues. Bibliothèques et librairies numériques ont en effet atteint une masse critique et bruyante, dans laquelle il n’est plus possible de s’orienter correctement sans informations descriptives fiables et standardisées. L’usager n’a plus forcément besoin de voir toutes ces données, mais les machines, elles, en ont besoin pour procéder aux indexations et aux calculs permettant de lui livrer des résultats performants. Les services qui se développent en ligne brassent ses requêtes avec des données sur ses usages et préférences et des données sur les biens culturels et scientifiques : livres, articles, films, musiques, références sur les auteurs, les œuvres, les thèmes, les lieux, les dates… Qu’elles soient descriptives (l’équivalent des notices bibliographiques) ou analytiques (l’équivalent des notices d’autorité), ces informations se révèlent précieuses pour qualifier, référencer et découvrir intuitivement les ressources.

    S’insérer dans l’environnement web

    Rusés, les démons du catalogue semblent donc ressurgir, parés de nouveaux noms : métadonnées, données, data... Plus exactement, les données catalographiques tendent à s’émanciper de leurs systèmes et formats d’origine pour s’insérer dans l’environnement web. À tel point que certains évoquent désormais une revanche des catalogues, dépositaires de précieux gisements de métadonnées sans lesquelles les collections restent invisibles et la médiation impossible.

    Mais ce retour en grâce ne peut s’envisager sans une mutation profonde. Pour entrer dans le web, les données de bibliothèque ont besoin de changer de structure et de systèmes. Les bibliothécaires et leurs organisations de travail aussi. C’est tout l’enjeu de la transition bibliographique.

    1. de RDA en France au programme Transition bibliographique

    Le lancement du site Transition-bibliographique.fr en juin 2015 a marqué une évolution dans l’approche de ces enjeux par les pouvoirs publics (en l’occurrence, les agences bibliographiques nationales l’Abes et la BNF, et leurs ministères de tutelle, sous l’égide d’un Comité stratégique bibliographique). 

    La logique du document s’efface au profit de celle de l’information

    Les travaux engagés dès 2010 au sein des groupes « RDA en France » dans le cadre de 

    l’Afnor avaient pour vocation d’examiner l’opportunité et les modalités d’adoption par la France du nouveau code international de catalogage RDA (ressources : description et accès). Le lancement du programme national Transition bibliographique vise à replacer cette question dans une problématique plus globale qui s’intéresse aux différentes facettes de l’accompagnement au changement.

    Du point de vue de l’usager, l’enjeu essentiel de cette transition est de réussir à lui servir les données bibliographiques dans un modèle adapté au contexte numérique, où la logique du document s’efface au profit de celle de l’information, et qui permette notamment de regrouper derrière le concept d’œuvre toutes les éditions associées. 

    RDA-FR : Transposition française de RDA

    L’Eldorado des catalogues est donc bien le fameux modèle FRBR. Pour rendre leurs données solubles dans le web, il faudra aussi réussir à sortir du format Marc au profit des standards du web. RDA n’est finalement qu’une des modalités possibles de cette transition vers le modèle FRBR, le code étant biaisé par ses origines anglo-américaines qui ont conduit à une interprétation encore très limitative du modèle.

    Le groupe « Normalisation » du programme Transition bibliographique est chargé de rédiger le code français de catalogage RDA-FR : Transposition française de RDA, lequel préfigure un futur profil d’application français de RDA, comme il s’en dessine dans d’autres pays comme l’Allemagne. Les premiers éléments du code ont été publiés en 2015 et la révision des règles se poursuivra progressivement, à raison d’une mise à jour annuelle. Le groupe travaille aussi au rapprochement entre les règles de RDA et l’analyse catalographique française ou européenne en préparant des demandes d’évolution de RDA dans le cadre d’Eurig, un groupe d’intérêt européen qui dialogue avec les instances de gouvernance du code au sein desquelles il dispose depuis peu d’un siège.

    Bien que progressive, l’adoption d’un nouveau code impactera fortement les pratiques de production bibliographique. Alors que la dérivation de données se développe, elle n’aura toutefois pas les mêmes incidences partout. Là où l’on cataloguera encore de manière significative (agences bibliographiques, établissements spécialisés et patrimoniaux), le changement sera majeur. Ailleurs, les professionnels seront surtout concernés dans la mesure où il leur faudra manipuler ces données récupérées d’ailleurs.

    2. la FRBRisation en action

    S’il faut ainsi adapter le code RDA aux besoins des bibliothèques françaises tout en maintenant l’objectif d’une convergence avec les standards internationaux, ces travaux de normalisation ne doivent pas se faire hors sol. La normalisation doit avancer de concert avec des chantiers tangibles de « FRBRisation » rétrospective des données, qui confrontent les choix normatifs aux défis des traitements de masse. Ces chantiers sont d’autant plus attendus que beaucoup de bibliothèques et d’opérateurs privés qui réutilisent les données de la BNF ou de l’Abes, mais qui n’en produisent pas ou peu, dépendent de cette mise à disposition effective de données FRBRisées pour adapter ou repenser leurs propres systèmes et y injecter ces données sans avoir à en assurer eux-mêmes la transformation.

    De ce point de vue, les opérateurs publics sont entrés dans le vif du sujet. Des chantiers de traitement rétrospectif ont en effet été lancés en 2015 à l’Abes (dans le cadre des évolutions du Sudoc) comme à la BNF (autour du service Data.bnf.fr, dont les algorithmes permettent la création automatique d’œuvres et le reversement des liens correspondants dans les catalogues sources). En février dernier, la BNF a ainsi expérimenté le reversement dans son catalogue général de 157 000 nouveaux liens titres-manifestations calculés automatiquement par Data.bnf.fr. Les agences vont commencer de fait à mettre à disposition des données partiellement FRBRisées.

    Nouvelle ingénierie aussi bibliographique qu’algorithmique

    Le chemin à parcourir reste long pour transformer la totalité des notices, et tributaire d’aléas budgétaires et techniques. L’essentiel est que cette dynamique soit concrètement engagée. La montée en compétence des équipes en charge de cette nouvelle ingénierie aussi bibliographique qu’algorithmique est un point essentiel de la transition et conditionne son succès.

    Mais la politique d’ouverture juridique des données de l’Abes et de la BNF est un autre aspect important du dispositif. En adoptant la licence ouverte de l’État, qui autorise la réutilisation libre et gratuite des données moyennant citation de leur provenance, les agences ont en effet ouvert le canal par lequel les données transformées pourront être réutilisées. À la BNF, cette politique a eu un effet immédiat : près de 117 millions de notices ont été récupérées au format Marc au cours de l’année 2015 via ses produits et services bibliographiques, contre 70 millions l’année précédente ! Et c’est sans compter les données téléchargées par d’autres protocoles, en particulier ceux proposés par Data.bnf.fr, qui permettent à la fois le téléchargement de dumps au format RDF et, depuis 2015, des extractions sur mesure via un requêteur SparQL.

    3. nouveaux métiers, nouvelles organisations ?

    Quel sera l’impact de ces évolutions sur les métiers et l’organisation du travail ? On entrevoit deux tendances qui dessineront peut-être de nouvelles spécialisations des profils de catalogueurs.

    • Là où collections et missions justifieront que l’activité de catalogage original reste soutenue, il faudra apprendre à cataloguer selon les nouvelles règles RDA-FR et dans de nouveaux outils. On consacrera aussi plus de temps à l’enrichissement des fichiers d’autorité et à la création de liens vers ces données qu’aux descriptions bibliographiques, lesquelles seront plus fréquemment récupérées à la source.
    • Là où la création de notices sera devenue marginale, l’essentiel de l’activité portera sur la dérivation, l’intégration, le retraitement ou, plus globalement, la gestion de métadonnées produites par d’autres. Il ne faut pas sous-estimer l’expertise qui sera nécessaire pour orchestrer ces opérations, appelées à se développer compte tenu de la multiplication des interfaces et des services. Le data librarian devra maîtriser les processus de traitement automatisé des données, mais être aussi en mesure d’analyser leur structure, leur qualité, leur contenu.

    L’intelligence des catalogues devra continuer d’être enseignée et transmise

    De fait, même si les processus et les systèmes évolueront, l’intelligence des catalogues devra continuer d’être enseignée et transmise au risque de ne plus savoir exploiter ce qui fait la valeur ajoutée des bibliothèques dans le web. C’est pourquoi le programme Transition bibliographique comporte un volet formation et vise à impulser et accompagner les efforts de sensibilisation et de formation des catalogueurs, notamment relayés par les CRFCB (Centres régionaux de formation aux carrières des bibliothèques). Le groupe « Formation » du programme coordonne ces actions en formant des formateurs et en élaborant des supports pédagogiques adaptés : une première série de supports a ainsi été publiée en 2015.

    Les logiques de coopération sont également appelées à évoluer. Les établissements sont en attente de davantage de support de la part des agences publiques dans les domaines du contrôle qualité, de la fourniture et de l’enrichissement de métadonnées. Une répartition des tâches se dessine, la BNF pouvant exercer une responsabilité particulière pour le référencement des publications françaises soumises au dépôt légal (y compris des e-books, dont le dépôt légal est en cours d’expérimentation) et l’Abes se concentrer sur les thèses françaises et les ressources continues étrangères, au premier rang desquelles les ressources électroniques. Pour les agences, de nouveaux flux de données sont à créer ou à consolider avec le monde de l’édition et l’industrie des outils de découverte.

    Logiques de coproduction

    D’autre part, des logiques de coproduction (entre Abes et BNF, mais pas seulement) s’avèrent indispensables afin de faire masse des moyens dédiés au signalement. C’est le cas en particulier pour la maintenance des fichiers d’autorité qui, à l’instar du fichier Rameau, mériteraient d’être fusionnés et produits véritablement en collaboration. Ce projet a d’ores et déjà été identifié comme une priorité nationale et devrait faire l’objet d’une étude de préfiguration en 2017.

    Ces évolutions devront s’articuler avec d’autres initiatives nationales ou sectorielles visant à la constitution de réseaux d’établissements spécialisés dans l’enrichissement de corpus de métadonnées (dans le cadre du programme Collex et d’initiatives comme Cercles, expérimentées par l’Abes). Que l’on pense aux évolutions de WorldCat ou encore à Viaf (le Fichier international virtuel d’autorité) ou à Isni (Identifiant international standard pour les identités publiques), les dispositifs de mutualisation ne manquent pas non plus au niveau international. Ils constituent autant de leviers d’interopérabilité à l’échelle mondiale. Encore faudra-t-il rester vigilant quant à la gouvernance et aux modèles économiques de ces initiatives.

    4. de nouveaux systèmes pour de nouvelles données ?

    Enfin, il faut préparer l’évolution des systèmes de gestion à cette mutation afin que le marché de l’édition logicielle – libre ou propriétaire – puisse répondre aux besoins nouveaux. Le passage à RDA nécessitera en effet des outils et surtout un format de production adaptés à des catalogues FRBRisés. Le rôle du groupe « Systèmes et données » du programme Transition bibliographique est d’envisager quels pourraient être ces outils et de préparer la migration des données des catalogues actuels vers une nouvelle structuration de l’information. Ce groupe, dont la dynamique vient d’être relancée, devrait bientôt faciliter de plus nombreux points de contact entre représentants des agences, administrateurs de SIGB et éditeurs logiciels. Ces derniers sont autant en attente de données à réutiliser que de spécifications sur les standards, les formats et les fonctionnalités attendues. Parce qu’elles souhaitent conserver une neutralité vis-à-vis de sociétés commerciales en concurrence, les agences ne peuvent assurer un accompagnement personnalisé auprès des fournisseurs. Elles veilleront néanmoins à encourager, via le programme Transition bibliographique, l’animation d’un forum qui favorisera les échanges entre acteurs publics et privés.

    Repenser la stratégie informatique hors du modèle historique des SIGB

    Face à l’émergence du web sémantique en bibliothèque, notons que les besoins ne se limitent pas au développement logiciel : beaucoup d’établissements souhaiteraient repenser leur stratégie informatique hors du modèle historique des SIGB, mais se trouvent encore dépourvus de compétences pour l’envisager autrement : ce champ d’innovation constitue potentiellement un nouveau terreau d’activité, de conseil, de R&D et de formation.

    Du côté des agences, la question du changement des systèmes de production est enfin à l’ordre du jour. Tandis que l’Abes travaille au remplacement du Sudoc, la BNF espère dégager les moyens nécessaires à la refonte de son SI à partir de 2017. Quelques orientations se dégagent pour ce nouveau système : sans surprise, on en attend des fonctionnalités de catalogage capables de produire des données dans un format adapté à une structuration FRBR, et compatible avec le profil français de RDA ;  une architecture plus modulaire, capable notamment de gérer les fichiers d’autorité directement sur le web, dans une logique de coproduction ; des dispositifs favorisant le « cata-liage » vers les référentiels ; la constitution au cœur du système d’un véritable hub de retraitement des métadonnées, capable de servir différentes applications dans différents contextes et interfaces d’utilisation. n

    Gildas Illien
    [Diplômé de Sciences Po et de l’université McGill, Gildas Illien est conservateur général des bibliothèques. Il a rejoint la BNF en 2005 pour mettre en place le dépôt légal de l’internet. Il y dirige depuis 2011 le département de l’information bibliographique et numérique.]

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Information électronique professionnelle : il y a ceux qui en vivent et ceux qui la font vivre ! Entendez les éditeurs, agrégateurs et agences d’abonnement, d’un côté, et les scientifiques, chercheurs et bibliothèques universitaires, de l’autre...
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Rencontre avec Stéphane Roder, le fondateur du cabinet AI Builders, spécialisé dans le conseil en intelligence artificielle. Également professeur à l’Essec, il est aussi l’auteur de l’ouvrage "Guide pratique de l’intelligence artificielle dans l’entreprise" (Éditions Eyrolles). Pour lui, "l’intelligence artificielle apparaît comme une révolution pour l’industrie au même titre que l’a été l’électricité après la vapeur".
    Publicité

    sponsoring_display_archimag_episode_6.gif