En 1996, l'informaticien Brewster Kahle se lançait dans un projet improbable : archiver les pages web d'un internet encore balbutiant. Baptisée Internet Archives, cette initiative a donné naissance, en 2001, au site Wayback Machine qui permet de retrouver une page web telle qu'elle existait à une date précise. Près de trente ans plus tard, Internet Archive franchit le cap des 1 000 milliards de pages web archivées.
Accessibles sur la Wayback Machine, ces pages web sont collectées selon un protocole de couverture partielle. Les sites ne sont pas tous archivés et ils ne le sont pas en profondeur. Certaines pages dynamiques ou protégées ne sont pas sauvegardées intégralement. C'est particulièrement vrai pour les illustrations qui sont soit dégradées soit absentes de l'archive.
800 000 utilisateurs quotidiens
Lors de son lancement en 2001, Wayback Machine proposait déjà plus de 10 milliards de pages archivées. En 2016, la collecte portait sur plus de 500 milliards avant d'atteindre le chiffre symbolique de 1 000 milliards (1 trillion) en octobre 2025. Une volumétrie qui représente 100 000 téraoctets avec un rythme quotidien d'accroissement de 498 millions de nouvelles pages.
Au-delà des pages web, Internet Archives se révèle être un prodigieux gisement documentaire grâce aux collectes portant sur les images, les sons, les vidéos et les logiciels. On y trouve par exemple 140 000 images provenant du Metropolitan Museum of Art de New York et une riche collection d’images produites par la Nasa. Plus d'un million de logiciels ont également fait l'objet d'un archivage en ligne.
Wayback Machine revendique 800 000 utilisateurs quotidiens dans le monde entier et a noué des partenariats avec plus de 1 250 bibliothèques et institutions patrimoniales qui l'utilisent pour constituer leurs collections.