CET ARTICLE A INITIALEMENT ÉTÉ PUBLIÉ DANS ARCHIMAG N°387
Au sommaire :
- Cycle de vie de la data : l'affaire de tous !
- Bibliothécaire, documentaliste et data : vers un nouveau métier ?
- La data : un “document” comme un autre pour les veilleurs et les documentalistes ?
- Data librarian, au coeur du cycle de vie des données de la recherche
- Les archivistes se positionnent-ils assez sur le traitement de la donnée ?
- DPO face à la data : un chef d'orchestre qui donne le La
- Entre gouvernance et stratégie data, la DSI en première ligne
Commençons par revenir à l’étymologie. Les livres étaient une forme unique de transmission de l’information. La notion de document a permis d’y adjoindre des supports moins formels, tels que des lettres, des contrats ou des ordres. Mais, aujourd’hui, et c’est l’origine de notre réflexion, une partie importante du savoir ne réside pas dans des documents (numériques ou pas), mais dans des fichiers, des bases de données, ou encore dans les fameux vracs numériques, espaces plus ou moins organisés, mais porteurs de valeur.
Cartographier les livres ou les documents n’est plus suffisant. Dans un monde idéal, toutes les données seraient contextualisées et donc transformées en informations. Sommes-nous capables de recenser et d’interroger l’ensemble des données ou devons-nous limiter notre compétence aux informations ? De la réponse à cette question naîtra le choix de data- ou de info-.
Lire aussi : La médiation en mode IA, les bibliothécaires investissent ce nouveau terrain
La question du suffixe subsiste
Le suffixe -thécaire se réfère à une “thèque”, qui vient du grec et désigne un lieu où sont conservées des collections, comme une bibliothèque, une cinémathèque, une ludothèque ou… une infothèque (Définition proposée par le Larousse : Portail, centre d'information et de documentation multimédia.). Appliqué à nos “data warehouse”, “data lake” ou “data lakehouse”, aux noms, certes, poétiques, mais manquants d’ancrage historique, nous pourrions substituer le terme de “datathèque” (il serait d’ailleurs plus adapté de parler de “captathèque”, car les données n’ont pas été “données”, mais “captées” ; il s’agit cependant d’une autre histoire étymologique que nous n’aurons pas le loisir d’aborder ici). Les data étant contextualisées, complétées de métadonnées, le terme d’infothèque sera encore plus pertinent, même s’il conduit à éliminer de notre perspective les données qui n’auraient pas été transformées en informations.
Cela peut sembler un détail, mais tous les fichiers de données mal référencés, dont les contenus ne sont pas ou mal décrits, les métadonnées inexistantes, et les vracs numériques qui inondent nos serveurs partagés seraient exclus d’une infothèque, mais inclus dans une “datathèque”. Pour mieux comprendre la différence entre ces deux niveaux, reportez-vous à la norme ISO 24143 sur la gouvernance des informations, qui précise les définitions.
Lire aussi : Au Mucem, une convergence d'objectifs avant tout
Un "lieu", l’infothèque, et un métier ?
Restons-en à notre infothèque, mentionnée dans quelques pages web, qui doivent se sentir bien seules ! La personne responsable de sa gestion est donc, logiquement, un ou une “infothécaire”. ChatGPT m’en donne une définition forte à propos : "professionnel responsable de la curation, de la classification, de la documentation et de la mise à disposition des informations dans une organisation. Il agit à la croisée des chemins entre archivage, gouvernance des métadonnées, gestion de la qualité et valorisation des données, dans un rôle à la fois technique, éthique et informationnel". Il me semble qu’elle décrit parfaitement ce nouveau rôle, appliqué aux informations.
Au risque de bousculer un peu les professionnels les plus expérimentés, le bibliothécaire et le documentaliste doivent endosser les évolutions linguistiques de leurs fonctions. Certains bousculent les codes, comme Sébastien Dupré, documentaliste au Cirad, à Montpellier, qui aime à se qualifier lui-même de “bibliotaliste” et de “documenthécaire”. Deux termes que les évolutions récentes rendent de plus en plus perméables. Historiquement, le bibliothécaire est généraliste, mais il peut aussi avoir la charge d’une collection spécialisée. Quant au documentaliste, il étend ses fonctions à l’analyse, à la mise en perspective et la production d’un contenu.
Et voici venir un nouvel acteur : l’analyste de données ou scientifique de données ! Sa fonction ? Analyser des données, leur donner de la profondeur, les commenter, et produire des contenus informationnels. Le voici donc en recouvrement partiel avec le documentaliste ou l’infothécaire, s’ils s’intéressaient plus aux informations. Rien de grave, en soi. Mais beaucoup de professionnels de l’information regrettent que leurs professions ne soient plus "à la mode" et attirent moins, tout en étant mal rémunérées. Du côté des analystes de données, c’est l’inverse : on en manquerait de plusieurs milliers et leurs salaires affichés font souvent rêver.
Doit-on fusionner les métiers ? En inventer un nouveau ?
Posons la question sans a priori. Et alignons les trois métiers, pour constater qu’ils ont plus de points communs que de différences. Leur fusion intelligente nous conduit à définir les rôles de “l’infothécaire” ou de “l’infotaliste”.
Lire aussi : Data : une vigilance à chaque étape du cycle de vie
Aux États-Unis, le “data librarian” prend position
N’allons pas copier les Américains en tout, mais reconnaissons qu’ils sont parfois plus souples face à l’évolution. Dès 2018, Eric Johnson publiait un livre “Working as a data librarian”, divisé en huit chapitres et structuré suivant le cycle de vie de la donnée : modélisation de bases de données, collecte et enrichissement de données, recherche et interrogation, visualisation et présentation. Aujourd’hui, au moins mille personnes disposent d’un profil LinkedIn mentionnant cette fonction et de nombreux postes sont ouverts dans le monde entier.
Pour notre bibliothécaire ou documentaliste français, cela passe par une ouverture à ces nouveaux métiers, par l’acquisition de nouvelles connaissances, ainsi que par la maîtrise d’outils. S’il est un spécialiste des logiciels de gestion de bibliothèques et de Ged, il devra découvrir les bases de données, les systèmes de catalogage de métadonnées, les outils de requête et les logiciels de présentation, tels que PowerBI, Tableau ou Qlik.
Certaines de ces nouvelles tâches lui seront facilitées par l’intelligence artificielle (IA) générative. Éduqués sur des bases de connaissances internes et externes, les grands modèles de langage (LLM) assisteront dans la sélection des données, mais également dans leur présentation. Leurs capacités de rédaction challengeront la productivité de nos professionnels actuels. Tiraillés entre les progrès de l’IA générative et les compétences des analystes de données, nos documentalistes et bibliothécaires, qu’ils se renomment infothécaires et infotalistes ou pas, n’ont d’autres choix que de se remettre en question. Ils ont toutes les cartes en main ; parfois ne manque à certains que la volonté...