Article réservé aux abonnés Archimag.com

Bruno Ricard : "L'expertise des archivistes ne sera jamais remplacée par l'intelligence artificielle"

  • bruno-ricard-archives-nationales.jpg

    archives-nationals-projets-bruno-ricard
    "Je forme le vœu que le stockage sur ADN se développe en complément d’autres modes de conservation", explique Bruno Ricard. (Tritan Reynaud/Sipa Press)
  • Diplômé de l'École nationale des chartes et de l'Institut national du Patrimoine, Bruno Ricard est conservateur général du patrimoine. Il est également directeur des Archives nationales depuis 2019. Il revient sur les grands projets des Archives nationales. Retrouvez aussi le podcast de la rencontre en fin d'article.

    mail Découvrez L'Archiviste Augmenté, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des archives et du patrimoine !

    Les Archives nationales sont engagées depuis plusieurs années dans le chantier de l’intelligence artificielle. Quel est l’apport de l’IA dans le travail des archivistes ?

    Les archivistes recourent à l’intelligence artificielle depuis plusieurs années dans le cadre de la reconnaissance automatique des écritures manuscrites (ou HTR pour handwritten text recognition). Nos instruments de recherche sont, pour l’essentiel, numériques et accessibles en ligne dans notre salle de lecture virtuelle, mais une petite partie d’entre eux n’a pas encore été dématérialisée.

    C’est notamment le cas au département du Moyen-âge et Ancien Régime, pour 900 000 fiches et pages manuscrites de description de documents rédigées au XIXe et au début du XXe siècle.

    L’IA peut aider les archivistes à transcrire ces documents, mais cela ne se fait pas en appuyant sur un bouton. Ce sont les archivistes qui ont "entraîné la machine" pour la rendre capable de reconnaître les lettres, les mots et la structure des documents. Nous sommes parvenus à un taux de fiabilité de transcription de plus de 90 %.

    Lire aussi : Les archives en France, chiffres, enjeux et tendances

    Les archivistes doivent-ils craindre pour leur métier face à la puissance de l’IA ?

    Cette question est légitime, mais une intelligence artificielle ne peut pas fonctionner seule : elle a besoin d’un humain pour apprendre à déchiffrer correctement un document. Les archivistes sont paléographes et capables de lire le latin médiéval et l’ancien français, et ils comprennent des termes qui n’existent plus.

    Cette expertise académique ne pourra jamais être remplacée par l’IA. J’ajoute que face à la désinformation générée par l’IA, les archives apportent la preuve d’un événement et l’existence d’une parole prononcée.

    Vous avez créé une Direction du numérique et de la conservation au sein des Archives nationales. Pour quelle raison ?

    Il existait auparavant une direction qui remplissait à peu près les mêmes fonctions sous un autre intitulé qui rendait ses missions difficilement compréhensibles en dehors des Archives nationales. Cette direction renommée a deux missions principales : un volet numérique (collecte et pérennisation d’archives numériques, maintenance et développement du système d’information archivistique…), ainsi qu’un volet consacré à la conservation et à la reproduction.

    Nous l’avons dotée d’un nouveau service, le Lab des Archives, qui a vocation à porter les grands projets numériques innovants, notamment en matière de référentiels et de description.

    Cette direction confirme notre engagement dans le numérique qui a commencé dès la fin des années 1970. Les Archives nationales furent parmi les premières à collecter des archives nativement numériques avec les bases de données de l’Insee dans le cadre du programme Constance.

    Les Archives nationales ont dévoilé la plateforme Girophares en mai dernier. De quoi s’agit-il ?

    Girophares est une plateforme de transcription et d’indexation collaborative. Le collaboratif s’est développé assez rapidement dans les services d’archives, en particulier au sein des Archives départementales (la Vendée faisant figure de précurseur avec la création de dictionnaires collaboratifs sous la houlette de Thierry Heckmann).

    Lire aussi : Les Archives nationales lancent Girophares : participez aux projets collaboratifs

    À partir de 2015, les Archives nationales ont développé, à leur tour, quelques projets collaboratifs, comme celui sur les Ponts et chaussées ou celui sur les écoles en 1884. Mais nous ne disposions pas d’outil professionnel facilement utilisable.

    J’ai souhaité que l’on mette à disposition des bénévoles un outil simple proposant des corpus très diversifiés. Cet outil, Girophares, a été conçu sous la direction de Romain Legendre et de Thomas Van de Walle.

    Il propose aux volontaires d’indexer des fichiers ou registres relatifs aux émigrés de la Révolution française, aux ecclésiastiques catholiques sous la Troisième République, ou encore aux pourvois devant la Cour de cassation.

    Que sait-on des bénévoles qui utilisent Girophares ?

    Nous avons dépassé les 300 bénévoles, mais le RGPD nous interdit de collecter des informations personnelles sur nos internautes.

    Où en est Vitam, le programme d’archivage électronique de l’État ?

    Ce programme interministériel porté par le ministère de la Culture fait l’objet de plusieurs déclinaisons, au ministère des Affaires étrangères (programme Saphir), au ministère des Armées (programme Archipel) et bien sûr aux Archives nationales, avec la plateforme d’archivage Adamant, ouverte fin 2018, et qui reçoit régulièrement de nouveaux versements d’archives nativement numériques.

    Nous devons maintenant passer à l’échelle afin de faire face à des volumes de plus en plus importants. À titre d’exemple, là où, dans les cabinets ministériels, nous collections naguère plusieurs dizaines ou centaines de mètres linéaires de papier, nous collectons désormais surtout des messages électroniques.

    Lire aussi : Projet VaS, nouvelle offre de service interministérielle pour l'archivage électronique

    Au-delà des messageries, nous recevons aussi des fichiers bureautiques, des bases de données, des photographies et de l’audiovisuel numériques… Nous avons ainsi collecté les enregistrements vidéo des procès de crimes contre l’humanité et de crimes pour actes de terrorisme (notamment ceux des attentats de Charlie Hebdo, de l’Hyper Cacher et du 13 Novembre).

    Parallèlement, le programme Vitam propose aussi l’offre VaS (Vitam accessible en service), destinée à l’archivage électronique intermédiaire avant versement sur les plateformes d’archivage des services publics d’archives, dont celle des Archives nationales.

    Vous êtes intervenu au mois d’octobre dernier à Abu Dhabi, lors du Congrès international des archives, sur le thème de l’accès aux archives à distance. Où en sommes-nous, en France ?

    Je suis convaincu que les usagers se déplaceront moins à l’avenir, car cela a un coût et également un impact environnemental. Qu’ils habitent à Gap, à Bordeaux ou à Pointe-à-Pitre, les usagers estiment qu’ils n’ont pas à se déplacer à Pierrefitte-sur-Seine pour consulter des documents numériques. C’est donc à nous de nous adapter et non l’inverse.

    La première réponse que les archivistes apportent à cette demande, c’est la numérisation : les Archives nationales proposent 14 millions d’images, dont 11 millions accessibles en ligne via notre salle de lecture virtuelle. Si l’on ajoute les images numérisées proposées par les services d’archives départementales et municipales, ce chiffre est bien plus considérable.

    En revanche, tout ce que nous détenons ne peut pas être diffusé en ligne. Le RGPD nous interdit, par exemple, de diffuser des documents qui comportent des données à caractère personnel sensibles. Les documents relatifs à la Seconde Guerre mondiale ou à l’après-guerre ne sont pas encore tous diffusables sur internet.

    Ces contraintes juridiques fortes nous ont conduits à proposer un système d’accès sécurisé à distance avec authentification via FranceConnect pour accéder à des instruments de recherche et à des corpus numérisés qui sont communicables, mais pas diffusables sur internet. À ce jour, environ 600 comptes d’accès sécurisé ont été créés par des usagers.

    Lire aussi : Le Congrès international des archives ouvre ses portes à Abu Dhabi

    Le site des AN de Pierrefitte-sur-Seine va prochainement bénéficier d’une extension. Quel est le calendrier du chantier ?

    Le site de Pierrefitte a fêté cette année son dixième anniversaire. Il s’agit de l’un des plus grands bâtiments d’archives au monde, avec une capacité de 358 kilomètres linéaires.

    Pour autant, nous continuons de collecter beaucoup d’archives papier et nous avons dû y transférer la majeure partie des archives qui étaient auparavant conservées dans notre ancien site de Fontainebleau. L’extension de Pierrefitte, qui était à l’origine prévue pour 2040, doit désormais être construite dans des délais plus rapprochés.

    Nous avons retenu l’agence d’architecture L’AUC pour réaliser cette extension. Sa proposition architecturale, sous la forme d’une tour de vingt étages, crée une rupture avec le bâtiment très horizontal conçu par Massimiliano Fuksas.

    Cette tour de 72 mètres crée également un signal à l’échelle de Plaine Commune et nouera notamment un dialogue avec les deux autres points hauts des communes de l’ouest de la Seine Saint-Denis : la basilique de Saint-Denis, avec sa future flèche qui atteindra 86 mètres, et la célèbre tour Pleyel, qui culmine à plus de 120 mètres.

    Le chantier devrait commencer à la fin de l’année 2024 pour s’achever en 2027. L’ouverture du bâtiment est prévue pour fin 2027 ou début 2028. Cette extension offrira une capacité de conservation de 100 kilomètres supplémentaires, portant ainsi la capacité totale de Pierrefitte à 458 kilomètres linéaires.

    Cela veut-il dire que la production d’archives au format papier ne baisse pas ?

    Il y a vingt ans, nos prédécesseurs estimaient que le papier allait rapidement disparaître. Or, vingt ans plus tard, nous collectons toujours beaucoup de papier. Notamment des archives, parfois anciennes, encore conservées dans les administrations, et surtout chez les opérateurs de l’État : Office national des forêts, Institut géographique national… Certains de ces opérateurs détiennent encore d’importants stocks que nous allons devoir traiter pendant de nombreuses années encore.

    Lire aussi : Le conditionnement des archives : un marché toujours dynamique

    La courbe de production d’archives papier finira cependant par être décroissante et sera dépassée par la courbe ascendante des archives nativement numériques. Alors que nous collectons environ cinq kilomètres d’archives papier chaque année, nous nous attendons à n’en collecter qu’un, deux ou trois kilomètres d’ici quinze à vingt ans. L’extension du site de Pierrefitte devrait donc répondre à nos besoins pour plusieurs décennies.

    Quels sont les chiffres de fréquentation des salles de lecture des Archives nationales et des expositions qui y sont organisées ?

    La fréquentation sur nos sites a connu un trou d’air en 2020 et 2021, pendant la crise sanitaire, puisque les salles de lecture sont restées fermées pendant plusieurs mois, puis ouvertes avec des horaires restreints. La très bonne nouvelle, c’est que la fréquentation de nos salles de lecture est désormais revenue à son niveau d’avant la pandémie, avec 120 000 cartons et registres communiqués en 2022. Le public qui fréquente nos salles de lecture est essentiellement constitué de chercheurs, d’étudiants et d’universitaires, mais aussi de généalogistes professionnels ou amateurs.

    La fréquentation de nos expositions, quant à elle, a fortement augmenté (+ 120 %) entre 2021 et 2022, avec près de 180 000 entrées à l’Hôtel de Soubise, au cœur de Paris. Ce chiffre est considérable quand on le rapporte à notre surface d’exposition.

    Par ailleurs, nous avons lancé un cycle "Les Essentiels", qui présente quelques documents exceptionnels : la Déclaration des droits de l’homme et du citoyen de 1789, le décret de l’abolition de l’esclavage de 1848, l’ordonnance de 1944 qui accorde le droit de vote aux femmes… Nous avons reçu plus de 50 000 visiteurs pour chacune de ces petites expositions.

    Au printemps prochain, nous présenterons un autre document iconique choisi par le public : le discours manuscrit, annoté et prononcé par Simone Veil à l’Assemblée nationale en 1974 pour défendre le projet de loi sur le droit à l’interruption volontaire de grossesse.

    En 2021, vous avez présenté une première mondiale : l’archivage sur ADN. Cette révolution de stockage a-t-elle une chance de devenir opérationnelle un jour ?

    Je l’espère ! Ce que nous avons présenté en 2021 est une expérimentation visant à démontrer que l’on peut stocker de l’information sur ADN. Je rappelle que l’ADN est durable, quelles que soient les conditions climatiques, et qu’il ne nécessite aucune énergie pour être conservé.

    Lire aussi : Patrick Dufour : "L'ADN synthétique permettrait de conserver toute la mémoire de l’humanité"

    Cela répond à plusieurs de nos enjeux : transmettre l’information aux générations futures sur le temps très long et réduire notre consommation d’énergie. Ce support ne coûte rien à l’exception de son développement. Je forme le vœu que cette technologie se développe en complément d’autres modes de conservation.

    Cela prendra un peu de temps, probablement plusieurs décennies avant d’atteindre un stade "industriel". Et cela ne veut pas dire que ce que l’on stockera sur ADN sera détruit : il s’agira d’une duplication de sécurité.

    Vous avez été nommé à la tête des Archives nationales en 2019. Souhaitez-vous prolonger votre mandat ?

    J’ai été reconduit à la tête des Archives nationales à deux reprises et mon mandat ne peut pas durer plus de six ans. Il s’achèvera donc en 2025.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    prevenir-guerir-infobésité
    Omniprésence de l’information, surabondance d’applications et d’outils, avalanche de données… Pris dans ces flux numériques ininterrompus, sommes-nous toutes et tous devenus infobèses? Les symptômes de cette maladie contemporaine permettent de poser un premier diagnostic : […] l’infobésité pose de sérieux défis aux organisations, aux individus, comme à la planète.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    Serda Formations Archives 2023

    Indispensable

    Bannière BDD.gif