Publicité

Plus d'un tiers des pages web ont disparu en l'espace de dix ans

  • web_404.jpg

    Plus-un-tiers-pages-web-ont-disparu-en-espace-dix-ans
    54 % des pages Wikipédia contiennent au moins un lien brisé (Freepik Premium / witsanu_sinlapachai)
  • 38 % des pages web qui existaient en 2013 ne sont plus accessibles une décennie plus tard, un phénomène qui touche quasiment tous les types de site web notamment Wikipédia.

    Erreur 404. Tous les internautes sont tombés sur ce message indiquant une page web supprimée, introuvable ou déplacée. Cette mésaventure s'explique : 38 % des pages web qui existaient en 2013 ne sont pas disponibles aujourd'hui. Selon une enquête menée par l'institut Pew Research Center, "dans la plupart des cas, cela s'explique par le fait qu'une page a été supprimée ou supprimée sur un site web par ailleurs fonctionnel."

    Pour les auteurs de l'étude, cette "dégradation numérique" touche aussi bien les sites institutionnels (gouvernementaux par exemple) que les sites d'information ou Wikipédia notamment la section "Références" particulièrement riche en liens sortants. Du côté des sites gouvernementaux, 21 % des pages contiennent au moins un lien brisé, un chiffre qui monte à 23 % pour les sites d'actualité et qui culmine à 54 % pour Wikipédia !

    Près d'un tweet sur cinq n'est plus visible publiquement

    Les réseaux sociaux ne sont pas épargnés, à commencer par X. "Près d'un tweet sur cinq n'est plus visible publiquement sur le site quelques mois seulement après avoir été publié" constate l'étude ; "dans 60 % de ces cas, le compte qui a publié le tweet à l'origine a été rendu privé, suspendu ou entièrement supprimé. Dans les 40 % restants, le titulaire du compte a supprimé le tweet, mais le compte lui-même existe toujours."

    Pour réaliser cette étude, le Pew Research Center s'est basé sur un échantillon aléatoire de près d'un million de pages web collectées par le service d'archives Common Crawl. Il a ensuite échantillonné les pages collectées chaque année de 2013 à 2023 (environ 90 000 pages par an) et vérifié si ces pages existaient encore aujourd'hui.

    Précision importante, cette étude porte uniquement sur des pages web anglophones et des sites officiels nord-américains.

     

    À lire sur Archimag
    Les podcasts d'Archimag
    Rencontre avec Stéphane Roder, le fondateur du cabinet AI Builders, spécialisé dans le conseil en intelligence artificielle. Également professeur à l’Essec, il est aussi l’auteur de l’ouvrage "Guide pratique de l’intelligence artificielle dans l’entreprise" (Éditions Eyrolles). Pour lui, "l’intelligence artificielle apparaît comme une révolution pour l’industrie au même titre que l’a été l’électricité après la vapeur".