Article réservé aux abonnés Archimag.com

DataLab : sur quels projets de recherche travaille ce service dédié aux données de la BnF ?

  • bnf-datalab.jpg

    bnf-datalab
    BnF DataLab : il faut descendre dans les entrailles de la BnF et rejoindre la salle X pour profiter des espaces particulièrement soignés mis à disposition des chercheurs. (Bruno Texier/Archimag)
  • Inauguré en octobre 2021, le BnF DataLab a pour ambition d’aider les chercheurs à appréhender et exploiter les immenses collections numériques de la Bibliothèque nationale de France. Fouille de textes, analyse d’images et intelligence artificielle sont au cœur de ce programme. Sur quels projets de recherche travaillent ces data librarians ? Visite dans ce service qui navigue au milieu d’un océan de données.

    Temps de lecture : 6 minutes

    mail Découvrez Le Bibliothécaire Innovant, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des bibliothèques !

    À quoi pensait François Mitterrand lorsqu’il annonça, le 14 juillet 1988, la construction « d’une bibliothèque d’un genre entièrement nouveau » ? En quelques mots, il esquissait un début de réponse :

    « je veux une bibliothèque qui puisse prendre en compte toutes les données du savoir dans toutes les disciplines et surtout qui puisse communiquer ce savoir à l’ensemble de ceux qui cherchent, qui étudient, de ceux qui ont besoin d’apprendre (...) et qui doivent trouver un appareil modernisé, informatisé et avoir immédiatement le renseignement qu’ils recherchent ».

    > Lire aussi : Data librarian et services à la recherche en bibliothèque universitaire : missions et compétences

    Le DataLab de la BnF, c'est quoi ?

    L’ancien président de la République est mort bien trop tôt – en 1996 – pour constater que son vœu a été exaucé au-delà de ses espoirs. Notamment avec le DataLab de la Bibliothèque nationale de France.

    Ce service inauguré au mois d’octobre dernier s’adresse aux chercheurs qui souhaitent exploiter les très riches collections numériques de la BnF : les documents issus de la numérisation des collections et mis en ligne sur Gallica bien sûr mais aussi les ressources électroniques acquises, les collections audiovisuelles et multimédias sur support (jeux vidéo, CD-Rom, DVD…), les archives de l’internet, les métadonnées des différents catalogues…

    datalab-bnf-collections-donnees

    « Ces collections numériques sont un formidable réservoir de données mais elles ne sont pas toujours faciles à appréhender », constate Marie Carlin, coordinatrice du BnF DataLab ; « elles ouvrent de nouveaux champs de recherche et suscitent de nouveaux usages comme la fouille de texte, la visualisation des données ou l’analyse d’images. Nous avons pour objectif d’accompagner les chercheurs à exploiter au mieux tous ces corpus ».

    > Lire aussi : Les 3 meilleurs moteurs de recherche académiques pour chercheurs et étudiants

    Travailler sur des corpus dans le respect du droit d’auteur

    Il faut descendre dans les entrailles de la BnF et rejoindre la salle X pour profiter des espaces particulièrement soignés mis à disposition des chercheurs : de confortables salles de travail, des box individuels ainsi qu’une infrastructure informatique composée d’espaces de stockage, de machines virtuelles sécurisées ....
    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    archives-numeriques-bonnes-pratiques
    Disposer d’archives numériques est une opportunité pour valoriser ses fonds. Une démarche qui vaut autant pour les organismes publics que pour ceux du privé. Valorisation en ligne, via les réseaux sociaux, réalisation d’une exposition virtuelle, etc. : cela est une affaire de stratégie, de ciblage et de réflexion sur les usages. Vient alors la mise en oeuvre.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Le chiffre du jour
    1
    est en moyenne signalée toutes les semaines dans les établissements de santé depuis janvier 2021. Les hôpitaux ont subi 27 cyberattaques majeures - qui ont effectué tout ou partie de leurs systèmes d'information - en 2020.

    documentation-couv-serda-formation.png