
RETROUVEZ CET ARTICLE ET PLUS ENCORE DANS NOTRE GUIDE PRATIQUE : STRATÉGIE DATA : TIREZ PROFIT DE L’INTELLIGENCE DES DONNÉES
Découvrez Le Brief de l'IT, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des data, de l'IT, de la digitalisation et de la transformation numérique !
De 1909 à 1931, le banquier et mécène Albert Kahn a financé des centaines de campagnes de prises de vue à travers le monde. De ces voyages, il reste aujourd’hui des centaines d’heures de films et une collection unique de 72 000 autochromes (photographies en couleurs sur plaques de verre) qui témoignent de la vie quotidienne au Japon, au Brésil, en Égypte et en France au début du XXe siècle. Connues sous le nom d’Archives de la Planète, ces collections sont hébergées au musée Albert Kahn de Boulogne-Billancourt, dans les Hauts-de-Seine.
Bonne nouvelle, elles sont également accessibles en ligne grâce à un important traitement documentaire engagé il y a plus de vingt ans et qui se prolonge aujourd’hui. "Nos contenus sont diffusés sur notre portail ainsi que sur le portail open data des Hauts-de-Seine, où l’on peut trouver les jeux de données du musée qui sont téléchargeables et réutilisables", explique Isabelle Peretti, chargée de la gestion informatisée des collections au sein du Musée Albert Kahn. "Point intéressant, nos collections en ligne sont très largement consultées par des internautes étrangers".
Lire aussi : Les archivistes se positionnent-ils assez sur le traitement de la donnée ?
Silos de données
Le musée possède plusieurs silos de données organisés autour d’une architecture qui prend appui sur un pilier : le NAS-Media. Celui-ci accueille la totalité des médias produits par le musée, soit un ensemble hybride de données images (42 To) et de stockage à froid sur bandes LTO (Linear Tape-Open : stockage sur bande magnétique) qui représentent 112 To.
Relevés à la mi-mai 2025, ces chiffres sont en constante augmentation au fur et à mesure de la numérisation des collections. Côté images fixes, les prestations de numérisation représentent une volumétrie prévisionnelle annuelle de plus de 350 Go en stockage chaud et de plus de 330 Go en stockage froid. Bien plus gourmands, les films numérisés s’élèvent à plus de 29 To par an en stockage chaud et à plus de 53 To par an en stockage froid (soit 208 To à 514 To sur un marché de numérisation de quatre ans). Autre type de contenus produits par le musée, les données bureautiques, utiles à l’activité quotidienne, représentent à ce jour 18 To.
Métadonnées, indexation et thesaurus
Pour Isabelle Peretti, de tels volumes requièrent une infrastructure robuste et capable d’absorber d’importantes montées en charge : "nous avons d’importants besoins en stockage liés à la numérisation des films. Nous numérisons en effet les bobines originales sans doute pour la dernière fois, celles-ci étant très dégradées et proches de la mise en destruction. Il s’agit d’un chantier exceptionnel auquel il faut ajouter le portail Images et les nombreux téléchargements et réutilisations des données produites par le musée."
Lire aussi : Reconnaissance de l’écriture manuscrite : les carnets de Clémence DesRochers à l’épreuve de l’IA
Chaque fichier est accompagné d’une notice enrichie de nombreuses métadonnées : date de prise de vue, lieu, nom de l’opérateur de la prise de vue, conditions de réutilisation, légende d’époque et légende actuelle… L’indexation a été réalisée à l’aide de deux thesaurus en interne, puis externalisée en raison de l’immensité de la tâche.
Pour les internautes qui se rendent sur le portail du musée, ce traitement documentaire se traduit, entre autres, par une magnifique valorisation sous forme de cartes interactives, qui permettent de suivre les itinéraires des opérateurs dans les Balkans ou en Mongolie. C’est le cas du photographe Stéphane Passet qui, en 1913, a parcouru la Mongolie pour en rapporter des films et des autochromes. Toutes les données associées à ce patrimoine ont été utilisées pour constituer une "story map" mêlant iconographie, textes et carte.
"Ces valorisations seront également poursuivies et enrichies au fur et à mesure de la documentation des fonds", explique-t-on au musée Albert Kahn. De même, le portail d’images sera entièrement refondu l’an prochain afin d’offrir un accès cartographique et des notices complètes des œuvres.











