Réseaux sociaux : un gisement d’archives à valoriser ?

Est-il bien raisonnable pour les entreprises d’archiver les messages qu’elles publient sur les réseaux sociaux ? La réponse tient en un mot : non. Elles n’en ont ni l’obligation légale, ni probablement les moyens. Mais il existe des outils pour procéder à une collecte ciblée des contenus les plus représentatifs et les valoriser.

RETROUVEZ CET ARTICLE ET PLUS ENCORE DANS NOTRE MAGAZINE : CONSTRUIRE ET ENTRETENIR SON STORYTELLING AVEC LES ARCHIVES

Au sommaire :
- Construire et entretenir son storytelling avec les archives : les agences témoignent
- Fédérer les équipes autour du patrimoine : quand la mémoire des marques permet d’innover
- Storytelling et archives : qui pour porter le projet ? Mieux vaut-il piloter ce projet en interne ou faire appel à des experts ?
- Réseaux sociaux : un gisement d’archives à valoriser ? Comment collecter et valoriser ces contenus ?

Au mois d’avril 2010, la Bibliothèque du Congrès de Washington (États-Unis) annonçait son intention d’archiver l’ensemble des messages publiés sur Twitter. Un projet gargantuesque : 140 millions de tweets par jour en 2011, 400 millions deux ans plus tard… Et une courbe qui n’a cessé de croître à une vitesse vertigineuse au fil des mois. En 2013, l’institution annonçait avoir déjà procédé à l’archivage de 170 milliards de tweets pour la période allant de 2006 (année de la création de Twitter) à 2010.

Un archivage exhaustif irréaliste

Las ! Face à l’explosion des volumes, la bibliothèque nationale américaine prit finalement la décision radicale de cesser l’archivage exhaustif de Twitter. "À partir du 1er janvier 2018, la bibliothèque conservera les tweets sur la base d’une sélection similaire à celle que nous pratiquons pour les sites internet", indiquait l’institution, qui évoquait alors des considérations liées à l’environnement, à la diversité de ses archives et de leurs sujets et aux coûts. Autre raison invoquée, le manque de capacités techniques pour archiver des messages souvent accompagnés d’images et de vidéos. En 2019, des projections basées sur les volumes quotidiens estimaient qu’environ 1 100 milliards de tweets avaient été postés depuis 2006.

Autant le dire tout de suite, l’archivage exhaustif des réseaux sociaux est tout simplement irréaliste, y compris pour une institution aussi puissante que la Bibliothèque du Congrès américain. Première difficulté qui saute aux yeux de tous les professionnels de l’information : la volumétrie des données. Les contenus produits (publications, images, vidéos, commentaires, likes, partages…) ont atteint un tel niveau qu’il est aujourd’hui difficile de l’évaluer avec précision. Une chose est sûre, le coût de leur collecte et de leur stockage serait exorbitant.

Archiver pour répondre à des obligations

Autre question, est-il bien raisonnable pour une organisation d’archiver tous les messages qu’elle publie sur les différentes plateformes ? En France, les entreprises n’ont aucune obligation légale d’archiver les posts qu’elles publient sur les réseaux sociaux. Mais, dans certains secteurs réglementés, comme la banque, il est tout de même conseillé de mettre en place une politique d’archivage des contenus publiés sur les réseaux sociaux.

Dès 2016, l’ACPR (Autorité de contrôle prudentiel et de résolution) recommandait de "mettre en œuvre une politique d’archivage de ces contenus qui permette de répondre à l’objectif de contrôle […] et aux fins de traitement d’éventuelles réclamations". Cette recommandation était assortie d’une contrainte : "veiller à ce que cet archivage soit réalisé en conformité avec les dispositions législatives et réglementaires en vigueur relatives à la conservation des données et soit stable en matière de support d’archive réglementaire en vigueur." Objectif : être en mesure de répondre à des obligations de contrôle, de traçabilité et de gestion des réclamations.

De façon concrète, le milieu bancaire est invité à définir les réseaux qui seront archivés et à sélectionner les types de contenus (publications, commentaires, messages privés, photos, vidéos…) ainsi que les comptes qui feront l’objet d’une collecte (profils officiels, comptes d’employés utilisés à des fins professionnelles). Il s’agit de dupliquer le principe de sélection documentaire tel qu’il est pratiqué par la Bibliothèque nationale de France (BnF) dans le cadre de sa mission du dépôt légal du web. Dans le cas de la filière bancaire, il faut y ajouter un point très important, celui des besoins de conformité.

Enregistrement irréversible

Autre écueil, les plateformes (X, YouTube, Instagram…) peuvent changer à tout moment leurs interfaces, leurs politiques d’accès ou leurs conditions d’utilisation, rendant la collecte automatisée incertaine. Elles font également évoluer leurs conditions générales d’utilisation (CGU), ce qui complique encore les modalités d’archivage. De quoi aiguiser l’appétit des sociétés spécialisées dans l’archivage du web. Ce marché a vu apparaître quelques acteurs, comme l’américain Proofpoint, qui commercialise un outil basé sur la technologie de stockage de données Worm (Write once read many). Cette technologie permet une écriture unique sur un support (disque, optique ou bande) : l’enregistrement est irréversible et ne peut donc être modifié. En revanche, il peut être lu à loisir sans altération du support.

Au-delà de la collecte, "le système d’archivage de l’organisation doit également prendre en charge la fonctionnalité de recherche", précise Proofpoint. Selon cet expert de la cybersécurité, les administrateurs, représentants légaux et tout autre utilisateur autorisé doivent pouvoir rechercher des messages dans les archives en fonction de mots-clés, de filtres, de la date et de la plateforme. Et les résultats de la recherche doivent leur permettre de naviguer facilement dans chaque message afin de pouvoir les examiner. "Ce système rend les informations plus accessibles lors d’une enquête et permet à l’organisation de rester conforme".

Les community managers à la manœuvre

Depuis leur apparition, il y a une vingtaine d’années, les réseaux sociaux servent de vitrine aux marques qui ne manquent pas de les utiliser pour gagner en visibilité et raconter leur histoire. À la manœuvre, les community managers ont pour missions de créer et d’animer une communauté d’internautes. Enrichir la page Facebook, publier des photos et des vidéos sur Instagram, éditer des articles sur LinkedIn, alimenter le site institutionnel… Un travail qui demande une solide connaissance du web et des habitudes des internautes. Autres qualités requises : la réactivité et l’humour, pour faire face aux internautes grincheux.

Lorsqu’une marque est connue du public, il peut être judicieux de partager d’anciens posts, photos ou vidéos pour montrer l’évolution de la marque, rappeler des moments clés ou célébrer des anniversaires. Le ton décalé est généralement très prisé des internautes qui n’hésitent pas à pousser un message humoristique. Les archives peuvent être sollicitées pour créer des visuels présentant les temps forts d’une campagne, d’un lancement de produit ou d’un événement. Elles sont aussi utiles pour réaliser des rétrospectives annuelles et les réussites de l’année.

Passer par la case IA

La valorisation des archives des réseaux sociaux passe également par la case IA. En particulier grâce au nettoyage et à la normalisation de ces archives qui contiennent du bruit (spams, fautes d’orthographe, abréviations, etc.). L’intelligence artificielle est capable d’identifier et de corriger ces données afin de les rendre exploitables. Tout comme elle est en mesure de repérer et d’extraire les entités nommées (noms de marques, de lieu ou de personnalités) pour faciliter la recherche et la catégorisation.

Autres atouts, les algorithmes classent les contenus archivés par thème, sujet, sentiment, type de publication (promotionnel, service client, actualité) ou toute autre catégorie pertinente pour l’entreprise. Cela représente une aide bienvenue pour structurer des volumes importants de données non structurées. Sans oublier la détection de doublons ou de messages très similaires qui encombrent inutilement les serveurs et nuisent à la pertinence des résultats.

Il n’est pas rare qu’une organisation compte des milliers de messages sur X ou Instagram. Là aussi, l’IA se révèle plus efficace que l’humain pour trouver rapidement des informations spécifiques dans les archives.