Zombie : l'application open source indispensable pour redonner vie à d'anciens contenus

  • zombie_letemps.jpg

    zombie
    Le concept de Zombie : conseiller les éditeurs de contenus web et les community managers sur le meilleur moment pour republier de bons contenus et ainsi élargir leur audience. (Photo via kpgolfpro via Visualhunt)
  • Une aubaine pour tous les sites de presse et leurs community managers, qui pourront bientôt identifier automatiquement dans les anciens contenus publiés ceux qui pourraient, au regard de l'actualité, intéresser à nouveau leurs lecteurs.

    Bonne nouvelle pour les médias en ligne ! Le quotidien suisse Le Temps s'apprête à développer une application qui pourrait bientôt profiter à tous : un algorithme prénommé Zombie destiné à identifier, parmi tous les articles déjà publiés par un site, à quel moment republier certains contenus et ainsi leur donner une seconde vie. Là où les autres éditeurs web sont également concernés par cette innovation, c'est parce que le code informatique de cette application sera open source, c'est à dire qu'il pourra être librement et gratuitement réutilisé par d'autres !

    Le Temps a de quoi se réjouir : il fait partie des 124 bénéficiaires à se partager les 24 millions d'euros offerts par la Digital News Initiative, un fonds européen financé par Google. Lancé en 2015, il vise à financer des projets innovants dans le secteur des médias. Grâce à cette aide, le Temps dispose donc de 45 000 euros pour développer son algorithme Zombie. 

    Pour resservir la même soupe ?

    Concrètement, c'est aux articles dits "evergreen", que Zombie souhaite s'intéresser : des articles qu'on qualifie de "durables", c'est à dire qui peuvent s'avérer pertinents pour les lecteurs, plusieurs jours, plusieurs mois, voire plusieurs années après leur publication. Il peut s'agir par exemple d'un éclairage historique, d'une interview scientifique, ou du portrait d'une personnalité.

    Ces articles, bien que lus, appréciés et partagés par les lecteurs, sont naturellement "chassés" par les besoins de l'actualité : en quelques jours, il peuvent disparaître de la page d'accueil d'un site parce que de nouveaux contenus ont été publiés et n'être plus accessibles que par les moteurs de recherche. Pourtant, une actualité forte peut donner une seconde vie à d'anciens contenus qui pourraient ainsi être complétés par de nouvelles informations. Les lecteurs pourraient ainsi lire un article de qualité qui leur avait peut-être échappé, mis à jour et complété si besoin. Il ne s'agit en aucun cas de décongeler, pour resservir telle quelle, la même soupe que l'an dernier...

    La mémoire n'est pas toujours fiable

    Imaginez. Pensez à ce long portrait documenté de Fidel Castro, publié sur votre site internet il y a un peu plus d'un an. Le décès de l'ancien chef d'Etat cubain nécessiterait la republication rapide de ce portrait, dès le samedi 26 novembre au matin, en Une de votre page d'accueil. Pourtant, le journaliste qui l'a rédigé ne travaille plus chez vous, et votre rédacteur en chef a pris ses fonctions il y a seulement six mois. On est en plein week-end, peu de monde à la rédac'... Personne ne pense à rappeler au webmaster que cet article existe, qu'il pourrait être complété par des informations nouvelles et qu'il pourrait intéresser vos lecteurs ! N'oubliez pas que la mémoire de votre équipe est faillible. Et pourrait se souvenir des milliers d'articles, voire des centaines, publiés chaque année par un site de presse ?

    Comment ça marche ?

    Grâce aux données combinées de Chartbeat et Google Analytics, le site du Temps peut aujourd'hui mesurer son audience numérique : temps de lecture, historique de l'audience, partages sur les réseaux sociaux... le mixage de ces données attribue un score de pertinence à chacun de ses articles. Ensuite, les outils d'analyse sémantique de Zombie lui permettent d'attribuer automatiquement des métadonnées supplémentaires à ces articles : identification de personnalité, lieux, événements, etc. Grâce à ces deux paramètres, une base de données d'articles "evergreen" peut se constituer de façon pertinente. 

    Parallèlement, Zombie récupèrera plusieurs fois par jour le sujets et thèmes faisant l'actualité grâce à Google Trends, Google News et Trending Topics. En fonction des thèmes identifiés, Zombie pourra ensuite fouiller la base de données des articles "evergreen" pour voir si certains d'entre eux correspondent à ces actualités. Si c'est le cas, Zombie alerte ensuite la rédaction grâce à un mail quotidien, mais aussi par des alertes en temps réel via Slack.

    "De bons articles méritent une seconde chance"

    "Notre projet s’inscrit à la croisée de différentes problématiques que rencontrent les éditeurs de presse, explique Le Temps sur son blog : construire des indicateurs qualitatifs d’audience pour dépasser la logique simpliste du nombre de clics; assurer une meilleure diffusion du contenu pour en maximiser l’impact. Et de citer un article paru en janvier 2015 sur le site américain Vox, "Refreshing the evergreen" : "Dans un écosystème de l’information inondé par du contenu, souvent de faible qualité, de bons articles [...] restent de bons articles et méritent une seconde chance".

    Le code de Zombie sur Github

    cat_zombie.gifCar on parle bien ici de "bons articles", et pas de "papiers à clics". Oubliés, les lolcats et autres "pièges à clics" intitulés "... le troisième va vous étonner". Le score de l'audience numérique mesuré par Zombie ne prendra pas en compte le nombre de clics recueillis par un contenu. En effet, le nombre de vues sur un article ne reflète pas toujours (et même rarement) sa qualité !

    Et si Zombie sera dans un premier temps conçu comme un outil interne, ses résultats, s'ils sont pertinents, pourraient être dans un second temps proposés aux lecteurs par l'intermédiaire d'une newsletter, de son blog ou des suggestions en bas de leurs articles. Enfin, le code source de Zombie étant développé en open source, chacun pourra aller le récupérer, dès sa publication, sur Github.

    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    Serda Formations Data 2023