Plus d'un tiers des pages web ont disparu en l'espace de dix ans

  • web_404.jpg

    Plus-un-tiers-pages-web-ont-disparu-en-espace-dix-ans
    54 % des pages Wikipédia contiennent au moins un lien brisé (Freepik Premium / witsanu_sinlapachai)
  • 38 % des pages web qui existaient en 2013 ne sont plus accessibles une décennie plus tard, un phénomène qui touche quasiment tous les types de site web notamment Wikipédia.

    Erreur 404. Tous les internautes sont tombés sur ce message indiquant une page web supprimée, introuvable ou déplacée. Cette mésaventure s'explique : 38 % des pages web qui existaient en 2013 ne sont pas disponibles aujourd'hui. Selon une enquête menée par l'institut Pew Research Center, "dans la plupart des cas, cela s'explique par le fait qu'une page a été supprimée ou supprimée sur un site web par ailleurs fonctionnel."

    Pour les auteurs de l'étude, cette "dégradation numérique" touche aussi bien les sites institutionnels (gouvernementaux par exemple) que les sites d'information ou Wikipédia notamment la section "Références" particulièrement riche en liens sortants. Du côté des sites gouvernementaux, 21 % des pages contiennent au moins un lien brisé, un chiffre qui monte à 23 % pour les sites d'actualité et qui culmine à 54 % pour Wikipédia !

    Près d'un tweet sur cinq n'est plus visible publiquement

    Les réseaux sociaux ne sont pas épargnés, à commencer par X. "Près d'un tweet sur cinq n'est plus visible publiquement sur le site quelques mois seulement après avoir été publié" constate l'étude ; "dans 60 % de ces cas, le compte qui a publié le tweet à l'origine a été rendu privé, suspendu ou entièrement supprimé. Dans les 40 % restants, le titulaire du compte a supprimé le tweet, mais le compte lui-même existe toujours."

    Pour réaliser cette étude, le Pew Research Center s'est basé sur un échantillon aléatoire de près d'un million de pages web collectées par le service d'archives Common Crawl. Il a ensuite échantillonné les pages collectées chaque année de 2013 à 2023 (environ 90 000 pages par an) et vérifié si ces pages existaient encore aujourd'hui.

    Précision importante, cette étude porte uniquement sur des pages web anglophones et des sites officiels nord-américains.

     

    À lire sur Archimag
    Les podcasts d'Archimag
    La photographie possède un pouvoir fascinant : celui de capturer un instant et de le figer pour l’éternité. Elle raconte des histoires, qu’elles soient personnelles ou collectives, qui traversent le temps et façonnent notre passé, notre présent et notre futur. C’est pourquoi les albums de famille jouent un rôle si important dans la construction de nos souvenirs. Mais avec l’avènement de l’intelligence artificielle générative, capable de créer des images de plus en plus proches de la réalité, une question se pose : comment cette technologie va-t-elle influencer notre mythologie familiale ? Serge Tisseron, psychiatre et docteur en psychologie, explore depuis longtemps nos relations avec les technologies. En cherchant à recréer une photographie de son enfance, il s’est intéressé aux liens entre mémoire, photographie et intelligence artificielle. Il revient sur l’origine de son livre "Le jour où j’ai tué mon frère - Quand l’IA fabrique la photographie de nos souvenirs", publié aux Éditions Lamaindonne.