Vrac numérique : un chantier qui ne s'improvise pas

Quelle est l’origine d'un vrac numérique ? Comment se manifeste-t-il ? Quelle est son ampleur ? L’entassement croissant et pas toujours cohérent de documents sur les serveurs est un phénomène qui touche les entreprises comme les administrations. Pour faire face, à quelle théorie archivistique peut-on se rattacher ? Découvrez dans ce dossier complet une méthode pratique et rigoureuse qui permet de le résorber ainsi que différentes sortes d’outils logiciels à votre disposition pour cette gestion. Enfin, un retour d’expérience vous explique comment le ministère des Armées a adopté une solution de gestion des vracs numériques pour les milliers de documents de ses marchés publics, et les bénéfices retirés.

Temps de lecture : 6 minutes

Découvrez Le Brief de la Démat, la newsletter thématique gratuite d'Archimag dédiée à la transformation numérique des organisations !

Sommaire du dossier :

Vrac numérique : un chantier qui ne s'improvise pas
Traiter un vrac numérique : mode d'emploi
Vrac numérique : des outils pour le cerner
Vrac numérique et situation de crise au ministère des Armées

Doublons, triplons, fichiers périmés, nommage approximatif, versions redondantes… Ces fléaux sont aujourd’hui parfaitement identifiés par les professionnels de la gouvernance documentaire.

Les causes, elles aussi, sont bien connues : des serveurs organisés en silos, des applications dispersées sur lesquelles les salariés produisent et partagent leurs documents de travail, le manque de cohérence, etc. Et au rythme actuel de la croissance des volumes d’information, toutes les organisations seront confrontées, à un moment ou à un autre, à un problème de dispersion de leurs fichiers numériques.

Un vrac numérique : c'est quoi ?

vrac-numerique-illustration-barros Selon l’« Abrégé d’archivistique » qui fait autorité en la matière, le vrac numérique désigne un ensemble de documents bureautiques très hétérogènes se caractérisant par une absence fréquente de règles de classement et de nommage, l’utilisation de caractères susceptibles de poser des problèmes, un stockage aléatoire et une arborescence construite sans logique prédéfinie.

Lors de l’édition 2020 du salon Documation, la question du vrac numérique a fait l’objet de plusieurs conférences et confirmé une tendance :

« Ce déluge informationnel provoque de multiples désordres : perte de temps, risque de disparition de fichiers, redondance, conservation d’information inutile ou obsolète », constate Noureddine Lamriri (Everteam).

Vrac numérique : grosse perte de temps !

Tout salarié peut en effet témoigner du temps perdu à rechercher une information située dans un document qu’il a du mal à localiser : dans sa messagerie ? sur le disque dur de son ordinateur ? sur les serveurs de l’entreprise ? dans les nuages ? Selon certaines études, un salarié passe environ 7 heures et 30 minutes par semaine à rechercher une information. Ces chiffres seront bien évidemment contestés, mais ils révèlent l’ampleur du problème.

Et à cette perte de temps, on peut désormais ajouter tous les enjeux juridiques sur la protection des données personnelles liés au Règlement général sur la protection des données (RGPD).

Des outils pour fluidifier et automatiser

Par chance, des outils permettent aujourd’hui de fluidifier et d’automatiser la gouvernance documentaire. Ces outils procèdent dans un premier temps à une analyse d’un serveur via un connecteur. Dans un deuxième temps, ils produisent un graphique des fichiers détectés (format, poids, date de création…).

Des actions peuvent ensuite être lancées sur des lots déterminés selon des règles que l’utilisateur peut ajuster à la volée. Et pour gagner en efficacité, certains outils sont même en mesure de détecter les entités nommées (noms de personne ou noms d’entreprise) afin de leur assigner une action précise : archivage, création d’alertes, destruction

Autre outil, le moteur de recherche fédérée permet d’accéder à des contenus hétérogènes qu’ils soient structurés ou non. Doté d’une interface unique, il se révèle efficace pour trouver des informations localisées sur des applications métier de type CRM (logiciel de gestion de relation client) ou ERP (ou PGI, progiciel de gestion intégré).

E-discovery et suspension légale

La notion d’e-discovery est particulièrement présente dans le secteur juridique. Dans le cas d’un litige par exemple, la justice peut demander la suspension provisoire du traitement normal ou de la destruction de documents d’archives. Des logiciels permettent alors de procéder à une suspension légale tout en assurant la conservation des documents quelle que soit leur forme.

Autant dire que l’enjeu est considérable. Une organisation qui serait dans l’incapacité de restituer un document crucial s’expose à de lourdes sanctions et à des amendes particulièrement salées.

Utilisée depuis plusieurs années aux États-Unis, la procédure de e-discovery a été convoquée en matière de procédure civile dans le cadre de la phase précontentieuse lors de litiges. Elle l’est également dans le cadre d’audits en interne ou d’enquêtes à la demande d’un tiers.

Cette procédure s’est ensuite répandue en France au sein des filiales d’entreprises nord-américaines présentes sur notre sol. Elle prend par ailleurs tout son sens pour les organisations françaises qui sont en relation contractuelle avec les États-Unis. Les informations conservées en vue d’une éventuelle action en justice seront alors extraites via une plateforme de e-discovery. Il peut s’agir de correspondance électronique, de rapports internes, de comptes-rendus de réunions, de notes…

Traiter un vrac : un chantier qui ne s’improvise pas

Bonne nouvelle pour les organisations confrontées à un problème de vrac numérique : les logiciels embarquent des fonctions de plus en plus puissantes et capables, pour certaines d’entre elles, de traiter des volumes colossaux (jusqu’à plusieurs téraoctets). Et certaines règles de nommage peuvent être automatisées, faisant gagner un temps considérable aux professionnels de la gouvernance documentaire.

Ce dossier d’Archimag passe en revue plusieurs de ces outils et propose une approche très pratique du traitement du vrac numérique. Un chantier qui ne s’improvise pas et qui repose sur la création d’un solide plan de classement et de règles de nommage communes.

La normalisation du vocabulaire est indispensable à la cohérence des répertoires et des fichiers (voir notre article : Traiter un vrac numérique : mode d'emploi).

Des trois âges des archives au records continuum

Apparue au milieu du vingtième siècle et diffusée en France par l’archiviste Yves Pérotin (1922-1981), la théorie des trois âges des archives décrit les trois périodes du cycle de vie d’un document d’archive : les archives courantes (premier âge), les archives intermédiaires (deuxième âge) et les archives définitives (troisième âge). Enseignée pendant des décennies, cette théorie est cependant critiquée en raison, notamment, de son inadaptation aux flux numériques.

Au Québec, Yvon Lemay et Anne Klein plaident pour une nouvelle méthode autour du records continuum présenté comme « une approche ouverte, susceptible de favoriser diverses lectures, différentes interprétations. Le records continuum favorise une vision multidimensionnelle ». À leurs yeux, cette approche est plus souple et s’adapte mieux aux enjeux contemporains :

« À la différence de la théorie des trois âges, le records continuum vise à satisfaire des usages les plus variés — dans les domaines de l’éducation, de la recherche, de la pratique professionnelle, etc. ».

Ce débat a-t-il lieu ailleurs ? Oui, notamment en Australie et aux États-Unis. Mais pas assez dans le monde de la francophonie :

« Malheureusement peu connue dans le monde francophone, la modélisation de ce continuum est un changement de paradigme qui permet aux professionnels de l’information de pouvoir s’adapter aux évolutions technologiques, d’être proactifs dans les organisations et de s’insérer dans les dispositifs techniques et de qualité de celles-ci », estiment les experts Gilliane Kern, Sandra Holgado et Michel Cottin (Cinquante nuances de cycle de vie. Quelles évolutions possibles ? » Les Cahiers du numérique 2015/2) :

Cinquante nuances de cycle de vie. Quelles évolutions possibles ? de AssociationAF