Publicité

Plus d'un tiers des pages web ont disparu en l'espace de dix ans

  • web_404.jpg

    Plus-un-tiers-pages-web-ont-disparu-en-espace-dix-ans
    54 % des pages Wikipédia contiennent au moins un lien brisé (Freepik Premium / witsanu_sinlapachai)
  • 38 % des pages web qui existaient en 2013 ne sont plus accessibles une décennie plus tard, un phénomène qui touche quasiment tous les types de site web notamment Wikipédia.

    Erreur 404. Tous les internautes sont tombés sur ce message indiquant une page web supprimée, introuvable ou déplacée. Cette mésaventure s'explique : 38 % des pages web qui existaient en 2013 ne sont pas disponibles aujourd'hui. Selon une enquête menée par l'institut Pew Research Center, "dans la plupart des cas, cela s'explique par le fait qu'une page a été supprimée ou supprimée sur un site web par ailleurs fonctionnel."

    Pour les auteurs de l'étude, cette "dégradation numérique" touche aussi bien les sites institutionnels (gouvernementaux par exemple) que les sites d'information ou Wikipédia notamment la section "Références" particulièrement riche en liens sortants. Du côté des sites gouvernementaux, 21 % des pages contiennent au moins un lien brisé, un chiffre qui monte à 23 % pour les sites d'actualité et qui culmine à 54 % pour Wikipédia !

    Près d'un tweet sur cinq n'est plus visible publiquement

    Les réseaux sociaux ne sont pas épargnés, à commencer par X. "Près d'un tweet sur cinq n'est plus visible publiquement sur le site quelques mois seulement après avoir été publié" constate l'étude ; "dans 60 % de ces cas, le compte qui a publié le tweet à l'origine a été rendu privé, suspendu ou entièrement supprimé. Dans les 40 % restants, le titulaire du compte a supprimé le tweet, mais le compte lui-même existe toujours."

    Pour réaliser cette étude, le Pew Research Center s'est basé sur un échantillon aléatoire de près d'un million de pages web collectées par le service d'archives Common Crawl. Il a ensuite échantillonné les pages collectées chaque année de 2013 à 2023 (environ 90 000 pages par an) et vérifié si ces pages existaient encore aujourd'hui.

    Précision importante, cette étude porte uniquement sur des pages web anglophones et des sites officiels nord-américains.

     

    À lire sur Archimag
    Les podcasts d'Archimag
    L’intelligence artificielle s’infiltre partout. Dans nos recherches en ligne, dans nos recommandations culturelles, dans nos trajets quotidiens… Elle s’adapte, apprend, et devient une force invisible qui façonne nos décisions, souvent à notre insu. Mais que sait-on vraiment de ces IA qui nous entourent ? Pour les podcasts d’Archimag, et pour mieux comprendre leur influence sur nos vies et sur notre rapport à l’information, nous avons rencontré Laura Sibony. Enseignante à HEC et à Sciences Po, elle est l’auteure de Fantasia : contes et légendes de l'intelligence artificielle, publié en 2024 aux éditions Grasset. Dans son livre, Laura Sibony nous invite à regarder au-delà du spectacle de l’IA pour en comprendre les rouages invisibles. C'est pourquoi elle a choisi d’explorer l’IA à travers une approche originale plutôt que par la voie technique ou théorique.
    Publicité