Archivage du web : près de 800 To déjà collectés par la BnF

Le 22/08/2017 (Mis à jour le 23/08/2017) - Par Bruno Texier
Chaque année la Bibliothèque nationale de France fait une collecte annuelle de près de 4,5 millions de sites. (CC0 Public Domain)

L'archivage du web est un vaste chantier désormais bien entamé. La Bibliothèque nationale de France et l'Institut national de l'audiovisuel procèdent au dépôt légal du web depuis 2006. L'heure est aujourd'hui à la création de nouveaux modes d'exploration de ce patrimoine numérique.

L'année 2016 fut l'occasion pour les internautes de célébrer un double anniversaire. D'abord les vingt ans de la fondation Internet Archive qui s'est donnée pour objectif d'archiver le web mondial. Puis les dix ans du dépôt légal du web en France. Depuis 2006, la Bibliothèque nationale de France et l'Institut national de l'audiovisuel ont pour mission d'archiver le web français (en partie tout au moins).

Autant dire qu'en l'espace de deux décennies, l'archivage du web s'apparente à une tâche sans fin tant la production numérique explose année après année.

"510 milliards de pages pour Internet Archive auxquelles il faut ajouter...

À malin, malin et demi ? Aujourd’hui, la fraude documentaire peut se cacher partout : papiers d’identité, factures, diplômes, etc. Autant de documents où l’on a du mal à distinguer le vrai du faux. Jusqu’à ce que justement, les spécialistes du document s’en mêlent et mettent leurs technologies à disposition pour permettre des vérifications et lutter contre la fraude.
  ou  Abonnez-vous

À lire sur Archimag