CET ARTICLE A INITIALEMENT ÉTÉ PUBLIÉ DANS ARCHIMAG N°387
Au sommaire :
- Cycle de vie de la data : l'affaire de tous !
- Bibliothécaire, documentaliste et data : vers un nouveau métier ?
- La data : un “document” comme un autre pour les veilleurs et les documentalistes ?
- Data librarian, au coeur du cycle de vie des données de la recherche
- Les archivistes se positionnent-ils assez sur le traitement de la donnée ?
- DPO face à la data : un chef d'orchestre qui donne le La
- Entre gouvernance et stratégie data, la DSI en première ligne
De la naissance des données de la recherche, jusqu’à leur circulation, leur conservation et leur partage, les data librarians sont aux manettes pour gérer leur cycle de vie. Ces professionnels, qui ont émergé il y a moins d’une dizaine d’années pour faire face aux enjeux de reproductibilité, de valorisation et de financement scientifique, exercent en bibliothèques universitaires, ainsi que dans les unités et les instituts de recherche, et s’imposent comme des figures de plus en plus indispensables à la pérennité des projets.
"Ce profil, qui parle à la fois aux chercheurs, aux bibliothécaires et aux personnels techniques, est précieux", souligne Annerose Tartler-Ostrizek, ancienne data librarian. Actuellement data steward dans le cadre du projet FED-tWIN (un programme fédéral de recherche et de collaboration entre établissements scientifiques belges), elle aide différentes institutions à développer des interfaces et des formations pour la gestion et l’ouverture de leurs données.
Pour Judith Biernaux, data steward au sein du projet FedOSC, dédié à promouvoir l’open science auprès de la communauté scientifique fédérale belge, le métier de data librarian est étroitement lié aux besoins concrets des chercheurs. "La gestion des données de recherche consiste à positionner chaque projet sur le principe du “ aussi ouvert que possible, aussi fermé que nécessaire”, explique-t-elle.
Au quotidien, les professionnels mobilisent des outils numériques spécialisés pour accompagner chaque étape du cycle de vie des données. Par exemple, lors d’un projet de reconstruction virtuelle d’une bibliothèque, Annerose Tartler-Ostrizek a structuré les catalogues patrimoniaux à l’aide d’outils dédiés, comme "Transkribus pour l’OCR, puis une transformation XSLT vers du XML-TEI, un format standard pour les humanités numériques", afin de relier les données anciennes aux catalogues actuels.
Lire aussi : Fanny Sébire, data librarian au service de la recherche
Principes "FAIR"
De l’autre côté du Rhin, Adoc Lorraine est un service d’appui à la recherche intégré au réseau national des ateliers de la donnée. Il fonctionne comme un guichet unique, en lien avec les services juridiques et numériques. Laetitia Bracco, responsable de ce service et conservatrice des bibliothèques, a pris le virage des "data" en 2019, année où l’Agence nationale de la recherche (ANR) a rendu obligatoire la mise en place d’un plan de gestion des données (PGD) pour les projets financés. Ce plan formalise la manière dont les données sont produites, documentées, réutilisées et partagées pendant et après un projet. Au sein de l’Adoc Lorraine, Laetitia Bracco résume ses différentes missions à "un accompagnement à la rédaction de PGD, depuis le choix des outils de stockage et de traitement jusqu’aux formats des fichiers et à la publication".
La nuance entre les métiers de data steward et de data librarian reste subtile : le premier soutient les chercheurs et les accompagne dans la conformité des données, tandis que le second, davantage tourné vers l’ontologie et la structuration des données, intervient dès les plans de gestion des données pour anticiper les contraintes et garantir le respect des principes "FAIR" (facilement trouvable, accessible, interopérable et réutilisable).
Lire aussi : DataLab : sur quels projets de recherche travaille ce service dédié aux données de la BnF ?
Sensibiliser les chercheurs à la valeur de leurs données reste un défi majeur pour les data librarians, là où "les publications scientifiques sont encore survalorisées face aux données de la recherche", déplore Laetitia Bracco. Et trois pratiques s’avèrent essentielles : faire un plan de gestion de données (même sans obligation), utiliser des formats ouverts pour garantir la réutilisabilité et anticiper très tôt les questions juridiques et techniques, car, comme le rappelle Laetitia Bracco, "certains font appel à nous trop tard, quand les données sont déjà perdues ou difficilement réutilisables".
La production de données affronte de nouveaux enjeux, comme l’usage d’outils d’IA, qui manque encore, selon Judith Biernaux, de recul et d’esprit critique. Si ces outils facilitent l’analyse à grande échelle, ils renforceront certainement le rôle des spécialistes dans l’intégrité des données et la vigilance face aux biais.