Découvrez L'Archiviste Augmenté, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des archives et de la documentation !
Quels sont les modes d’archivage du web à la BNF et à l’Ina ?
L’Ina et la BNF procèdent à un archivage automatisé par robot d’indexation dans le cadre du dépôt légal du web créé par la loi DADVSI de 2006.
Les modalités ne sont pas figées, elles évoluent au gré de l’histoire du web, à l’image des réseaux socionumériques dont l’archivage nécessite de diversifier les stratégies de collecte.
> Lire aussi : Archivage du web : près de 800 To déjà collectés par la BnF
Quels usages les historiens font-ils de ces archives du web ?
Difficile de dresser une liste exhaustive des usages des archives du web par les historiennes et les historiens.
Les archives du web permettent de retrouver d’anciennes versions de sites, des contenus publiés sur la Toile il y a plus de 25 ans et qui ne sont plus en ligne actuellement. Par exemple, pour étudier les commémorations du 17 octobre 1961 en 2001 et en 2011 en ligne, la consultation du web archivé m’a permis d’exhumer des billets de blog, de courtes vidéos ou des webdocumentaires aujourd’hui inaccessibles.
Les archives du web sont aussi précieuses pour pérenniser des corpus issus du web vivant afin de garantir la citabilité des sources chère aux historiens. L’actualité ne manque pas d’événements donnant lieu à des projets de recherche concernant la création de corpus en ligne en vue de leur archivage et de leur analyse.
Enfin, les historiennes et les historiens contribuent à une réflexion épistémologique internationale dédiée à ce « reborn digital heritage » qui constitue aussi un champ de recherche à part entière.
> Lire aussi : Elles ont archivé le confinement : zoom sur 4 collectes d'archives pour l'Histoire
Quelles pistes méthodologiques proposez-vous aux chercheurs ?
Comme pour toute source, il faut au préalable connaître le processus d’élaboration des archives du web.
Ensuite, je suggère aux non-initiés de commencer par une approche qualitative à partir d’un seul site, afin d’étudier son archivage, de retracer son histoire, ses évolutions scénographiques comme son contenu, mais aussi de collecter des sources complémentaires. C’est l’occasion de s’acculturer progressivement au web archivé et de mesurer qu’il ne s’agit en aucun cas d’un miroir du web passé, mais davantage d’une reconstruction à partir de traces collectées.
Cette entrée au plus près des archives est tout à fait complémentaire avec le nécessaire recours aux approches computationnelles des humanités numériques fondées sur l’étude des métadonnées diffusées par les organismes d’archivage ou sur l’exploration massive de fichiers issus des archives du web dont les outils d’analyse restent encore largement à construire.
> Lire aussi : Archives : le Siaf publie un Guide d'indexation pour le web à télécharger