Comment le Québec utilise l'intelligence artificielle pour faire parler les archives

  • archives_univ_montreal.jpg

    Comment-Quebec-utilise-intelligence-artificielle-faire-parler-archives
    Un document issu du fonds Louis-François-Georges-Baby de l'Université de Montréal (Amélie Philibert, Université de Montréal)
  • L'Université de Montréal recourt à l'IA afin de déchiffrer l’écriture souvent illisible de documents manuscrits du XVIIème siècle.

    La Division des archives et de la gestion de l’information de l'Université de Montréal détient de nombreux documents notamment un fonds intitulé Louis-François-Georges-Baby. Ce corpus est composé de documents manuscrits relatifs aux populations autochtones du Québec. Problème : l'écriture manuscrite y est souvent illisible. Un défi pour les historiens alors que le fonds Louis-François-Georges-Baby est en mesure d'apporter des réponses à des questions historiques non résolues : quel sort était réservé aux personnes reconnues coupables de commerce illicite d’alcool en 1667 ? Quelle était l’étendue de la concession territoriale, dans les environs de Sillery, accordée en 1642 par les Augustines de l’Hôtel-Dieu de Québec aux Autochtones de Tadoussac ?

    Les équipes de l'Université de Montréal (UdeM) ont décidé de recourir à l'intelligence artificielle pour faire parler ces archives. En particulier le logiciel Transkribus dédié à la reconnaissance de texte, à l'analyse d'images et de reconnaissance de structure de documents historiques. "Une fois le document d’archives numérisé en haute résolution et téléversé dans Transkribus, le logiciel crée des modèles linguistiques à l’aide d’algorithmes d’apprentissage qui, en balayant les écritures, repèrent les mots et les tournures de phrases récurrents et parviennent à en déchiffrer le contenu" explique Jean-Olivier Dicaire-Leduc, étudiant au sein de l'UdeM.

    Améliorer les instruments de recherche

    Difficulté supplémentaire, la série N du fonds Baby comporte des documents hétérogènes : jugements de cour, contrats de concessions territoriales, observations démographiques; bons de marchandises... Et elle présente la particularité d'avoir été rédigée par différents auteurs, rendant le décodage plus complexe. "Les transcriptions automatiques effectuées par Transkribus comportent certaines erreurs, que j’ai corrigées afin de faciliter la lecture et le balisage" indique Jean-Olivier Dicaire-Leduc.

    L'apport de l'IA a un premier résultat concret : améliorer l’accès au contenu des documents grâce à la transcription aux fins d’indexation dans les instruments de recherche archivistiques, en particulier le catalogue Web (AtoM) des archives de l’Université de Montréal. Au-delà il s'agit pour Jean-Olivier Dicaire-Leduc de "faciliter l’accès à une partie de l’histoire de la Nouvelle-France et, possiblement, à la création d’instruments de recherche et d’outils de diffusion des archives accessibles à tous".

    Sur le même thème : Quand les archives font appel à l'intelligence artificielle   

    À lire sur Archimag
    Les podcasts d'Archimag
    La photographie possède un pouvoir fascinant : celui de capturer un instant et de le figer pour l’éternité. Elle raconte des histoires, qu’elles soient personnelles ou collectives, qui traversent le temps et façonnent notre passé, notre présent et notre futur. C’est pourquoi les albums de famille jouent un rôle si important dans la construction de nos souvenirs. Mais avec l’avènement de l’intelligence artificielle générative, capable de créer des images de plus en plus proches de la réalité, une question se pose : comment cette technologie va-t-elle influencer notre mythologie familiale ? Serge Tisseron, psychiatre et docteur en psychologie, explore depuis longtemps nos relations avec les technologies. En cherchant à recréer une photographie de son enfance, il s’est intéressé aux liens entre mémoire, photographie et intelligence artificielle. Il revient sur l’origine de son livre "Le jour où j’ai tué mon frère - Quand l’IA fabrique la photographie de nos souvenirs", publié aux Éditions Lamaindonne.

    Serda Formations Archives 2025

    Indispensable

    Bannière BDD.gif