Article réservé aux abonnés Archimag.com

Les archivistes face au management des données

  • archiviste_management_donnees.jpg

    archiviste-management-data
    Les archivistes - et plus largement les métiers de la documentation - ne cessent de s’interroger sur le rôle qu’ils peuvent être amenés à jouer face au chantier du big data. (Freepik/diana.grytsku)
  • Depuis plusieurs années, les archivistes s’aventurent sur le terrain des data et essaient de trouver leur place au côté des informaticiens. Une aventure dans laquelle ils ont quelques compétences à faire valoir.

    Temps de lecture : 6 minutes

    mail Découvrez l'Archiviste Augmenté, la newsletter thématique gratuite d'Archimag pour les archivistes !

    Au mois de décembre 2018, les Archives nationales organisaient leur grand hackathon au cœur de Paris. Objectif : proposer à des volontaires d’imaginer les moyens les plus originaux pour valoriser huit jeux de données prélevés parmi quatorze siècles d’archives conservées dans les différents magasins des Archives nationales.

    Des archivistes sur le terrain de l'exploitation des données

    Une série de missions était proposée aux participants : optimiser la base de la Légion d’Honneur afin de faciliter sa consultation par les citoyens, analyser et visualiser les archives des notaires de Paris (du XVIIe au XXe siècle), comprendre l’évolution du paysage de montagne à travers des fonds photographiques…

    archives-data-barros

    Un défi relevé pendant trois jours et deux nuits par plusieurs dizaines de personnes aux profils variés : des archivistes, bien sûr, mais aussi des développeurs informatiques et même des généticiens épris d’archives.

    Ce hackathon n’était pas la première immersion des archivistes sur le terrain de l’exploitation des données. Mais il marquait une étape importante :

    « Cet événement est un très beau succès en termes de participants, de qualité des projets présentés et d’implication des équipes des Archives nationales. Il s’inscrit dans une trajectoire de transformation des Archives nationales », nous déclarait Françoise Banat-Berger alors directrice des Archives nationales.

    enlightenedLire aussi : Archivage électronique : comment (bien) archiver des données sensibles ou confidentielles ?

    Réutiliser les données publiques

    Il faut remonter à 2010 pour voir les archivistes s’aventurer sur le terrain de la data. Cette année-là, l’Association des archivistes français se dotait d’un groupe de travail baptisé « Réutilisation des données publiques ».

    Objectif de l’AAF : mener « une réflexion collective avec l’ensemble des partenaires (ministériels, associatifs, économiques) à commencer par le Service interministériel des Archives de France » pour que les archivistes prennent leur place dans le mouvement.

    Quatre ans plus tard, une délégation de l’AAF se rendait au Sénat dans le cadre d’une mission d’information consacrée à l’open data et la protection des données personnelles. L’occasion de rappeler « le rôle pivot de l’archiviste dans la bonne gestion de l’information, sécurisée et souple, dans l’environnement numérique ».

    enlightenedLire aussi : Durées de conservation des documents papiers et numériques : les deux bases de données d'Archimag s'enrichissent de nouveautés !

    C’est à l’archiviste aujourd’hui de comprendre les enjeux du big data

    Depuis, les archivistes - et plus largement les métiers de la documentation - ne cessent de s’interroger sur le rôle qu’ils peuvent être amenés à jouer face au chantier du big data.

    Au côté des ingénieurs et des scientifiques de la donnée (data scientists), que peuvent-ils apporter ? Ont-ils des compétences particulières à faire valoir dans le traitement de corpus documentaires numériques ?

    « L’archiviste, dans son double rôle de records manager et de “conservateur”, est à même d’apporter son expertise de gestionnaire de l’information pour optimiser l’environnement big data des institutions », estime Alexandre Vieira dans un mémoire de fin d’étude publié par l’Enssib.

    À ses yeux, « les nouveaux volumes d’archives, tout comme leur variété, et les outils pour composer avec ces nouveaux défis propres à un environnement big data peuvent donner une nouvelle mission à l’archiviste : cela nécessite que les archives commencent à créer des index et des tables à partir de leur collection pour permettre ces analyses, ces calculs et non plus seulement pour trouver les documents unitaires.

    enlightenedLire aussi : Comment collecter des archives numériques en 10 points clés

    Organiser et structurer la donnée

    L’archiviste obtient un rôle organisationnel au niveau du document et de la donnée qu’il doit organiser, structurer aux mieux pour permettre de déployer une démarche macroanalytique sur ces ensembles.

    C’est à l’archiviste aujourd’hui de comprendre les enjeux du big data par rapport aux archives, alors que le terme recouvre ici une grande diversité d’éléments (données, documents, etc.).

    Il s’agit de valoriser l’archive sous l’angle du big data, afin que celle-ci soit valorisée et puisse apporter une valeur significative à ceux qui peuvent en tirer partie (pour la recherche, mais aussi pour toutes organisations, privée ou publique) ».

    enlightenedLire aussi : Vrac numérique : comment mettre en place une stratégie simple et moderne de records management

    Monter dans le train de l'open data

    À la SNCF, les archivistes sont montés dans le train de la donnée et plus précisément dans le wagon de l’ouverture des données publiques. Dotée de fonds d’archives riches et variés, la compagnie ferroviaire a lancé, en 2017, une plateforme Data.sncf sur laquelle on trouve désormais plus de 221 jeux de données : des statistiques relatives aux objets trouvés, la fréquentation ventilée par gares, la rémunération moyenne brute des agents…

    Ce projet n’aurait pas vu le jour sans la collaboration d’une multitude de métiers. Les archivistes y ont trouvé leur place au côté des informaticiens et des juristes réunis au sein d’un comité de pilotage. Ils ont pu notamment mettre en avant deux compétences : la connaissance des fonds d’archives qui alimentent la plateforme open data et la connaissance du droit des archives (communicabilité, droit d’auteur, etc.)

    Leur travail a également permis de valoriser les magnifiques fonds iconographiques de la SNCF. La plateforme Openarchives.sncf rassemble plus d’un millier de documents : des photographies et des films, bien sûr, mais aussi des plans de gare et de la documentation technique historique qui a servi au développement du TGV.

    Le tout est accessible via une élégante interface qui offre plusieurs modes de recherche (mot-clé, type de support, frise chronologique…). Cette vitrine numérique donne également l’occasion aux archivistes de répondre aux demandes ponctuelles du public sur des questions relatives au patrimoine documentaire de la SNCF.

    enlightenedLire aussi : Archivage numérique : InterPares, un projet pour garantir l’authenticité des archives

    Du projet E-Ark à eArchiving Building Block

    À l’échelle européenne, le projet E-Ark (European archival records and knowledge) a réuni 17 partenaires (des services d’archives nationales, des entreprises, des institutions de recherche…) et couvert la période 2014-2017.

    Il s’agissait alors « d’une archives pour l’Europe » explique Alexandre Vieira ; « E-Ark se place comme pilote pour les services d’archives dont la mission est d’assurer l’intégrité, la conservation et l’utilisation des données et documents à travers le temps. (…) Ici les données et documents à archiver représentent un volume de données aussi gigantesque que varié (le projet prévoit d’archiver tout type de données, depuis n’importe quelles sources) ».

    Devenue eArchiving Building Block, cette initiative fonctionne aujourd’hui avec un groupe d’experts dont la France fait partie. Elle s’adresse aux services d’archives, mais aussi aux producteurs de données et aux éditeurs de logiciels.

    enlightenedLire aussi : Qu'est-ce qu'un e-archiviste ? Découvrez son métier, ses difficultés et ses espoirs

    « Chacun, chaque pays peut interpréter le modèle OAIS (système ouvert d’archivage d’information) comme il l’entend », précise Janet Anderson, coordinatrice d’eArchiving Building Block dans Archimag ; « nous avons défini une spécification “common specification for information packages”. Elle est obligatoire, disponible et ouverte ».

    Les travaux d’eArchiving Building Block sont financés par la Commission européenne à hauteur de plus de 2 millions d’euros.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Archimag-droit-auteur-infodoc
    Vous êtes veilleur, documentaliste, community manager ou iconographe ? Vous recueillez de l’information textuelle, image ou vidéo que vous traitez et diffusez à vos utilisateurs ou clients sous forme de livrables ou autres ? Attention ! vous le savez, juridiquement, on ne peut pas faire tout ce que l’on veut avec l’oeuvre d’autrui. Il faut savoir situer où un droit d’auteur s’exerce, recourir rigoureusement au droit de citation, payer éventuellement une redevance, etc. Ce dossier fait témoigner différents métiers au sujet de leurs pratiques quotidiennes et propose un point juridique synthétique propre à chaque problématique, validé par le juriste Didier Frochot (Les Infostratèges). Une société de gestion du droit d’auteur, le Centre français d’exploitation du droit de copie (CFC), explique son rôle et son pouvoir de contrôle.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    Serda Formations Archives 2023

    Indispensable

    Bannière BDD.gif