Article réservé aux abonnés Archimag.com

Vrac numérique : un chantier qui ne s'improvise pas

  • vrac-numerique-chantier.jpg

    vrac-numerique-chantier
    Ce dossier d’Archimag passe en revue plusieurs outils et propose une méthode très pratique pour le traitement du vrac numérique. (Freepik/@chevanon)
  • Quelle est l’origine d'un vrac numérique ? Comment se manifeste-t-il ? Quelle est son ampleur ? L’entassement croissant et pas toujours cohérent de documents sur les serveurs est un phénomène qui touche les entreprises comme les administrations. Pour faire face, à quelle théorie archivistique peut-on se rattacher ? Découvrez dans ce dossier complet une méthode pratique et rigoureuse qui permet de le résorber ainsi que différentes sortes d’outils logiciels à votre disposition pour cette gestion. Enfin, un retour d’expérience vous explique comment le ministère des Armées a adopté une solution de gestion des vracs numériques pour les milliers de documents de ses marchés publics, et les bénéfices retirés.

    Temps de lecture : 6 minutes

    mail Découvrez Le Brief de la Démat, la newsletter thématique gratuite d'Archimag dédiée à la transformation numérique des organisations !


    Sommaire du dossier :

    Doublons, triplons, fichiers périmés, nommage approximatif, versions redondantes… Ces fléaux sont aujourd’hui parfaitement identifiés par les professionnels de la gouvernance documentaire.

    Les causes, elles aussi, sont bien connues : des serveurs organisés en silos, des applications dispersées sur lesquelles les salariés produisent et partagent leurs documents de travail, le manque de cohérence, etc. Et au rythme actuel de la croissance des volumes d’information, toutes les organisations seront confrontées, à un moment ou à un autre, à un problème de dispersion de leurs fichiers numériques.

    enlightenedLire aussi : Vrac numérique : comment mettre en place une stratégie simple et moderne de records management

    Un vrac numérique : c'est quoi ?

    vrac-numerique-illustration-barrosSelon l’« Abrégé d’archivistique » qui fait autorité en la matière, le vrac numérique désigne un ensemble de documents bureautiques très hétérogènes se caractérisant par une absence fréquente de règles de classement et de nommage, l’utilisation de caractères susceptibles de poser des problèmes, un stockage aléatoire et une arborescence construite sans logique prédéfinie.

    Lors de l’édition 2020 du salon Documation, la question du vrac numérique a fait l’objet de plusieurs conférences et confirmé une tendance :

    « Ce déluge informationnel provoque de multiples désordres : perte de temps, risque de disparition de fichiers, redondance, conservation d’information inutile ou obsolète », constate Noureddine Lamriri (Everteam).

    Vrac numérique : grosse perte de temps !

    Tout salarié peut en effet témoigner du temps perdu à rechercher une information située dans un document qu’il a du mal à localiser : dans sa messagerie ? sur le disque dur de son ordinateur ? sur les serveurs de l’entreprise ? dans les nuages ? Selon certaines études, un salarié passe environ 7 heures et 30 minutes par semaine à rechercher une information. Ces chiffres seront bien évidemment contestés, mais ils révèlent l’ampleur du problème.

    Et à cette perte de temps, on peut désormais ajouter tous les enjeux juridiques sur la protection des données personnelles liés au Règlement général sur la protection des données (RGPD).

    enlightenedLire aussi : Xelians s’appuie sur l’IA pour mettre fin au vrac numérique

    Des outils pour fluidifier et automatiser

    Par chance, des outils permettent aujourd’hui de fluidifier et d’automatiser la gouvernance documentaire. Ces outils procèdent dans un premier temps à une analyse d’un serveur via un connecteur. Dans un deuxième temps, ils produisent un graphique des fichiers détectés (format, poids, date de création…).

    Des actions peuvent ensuite être lancées sur des lots déterminés selon des règles que l’utilisateur peut ajuster à la volée. Et pour gagner en efficacité, certains outils sont même en mesure de détecter les entités nommées (noms de personne ou noms d’entreprise) afin de leur assigner une action précise : archivage, création d’alertes, destruction

    Autre outil, le moteur de recherche fédérée permet d’accéder à des contenus hétérogènes qu’ils soient structurés ou non. Doté d’une interface unique, il se révèle efficace pour trouver des informations localisées sur des applications métier de type CRM (logiciel de gestion de relation client) ou ERP (ou PGI, progiciel de gestion intégré).

    E-discovery et suspension légale

    La notion d’e-discovery est particulièrement présente dans le secteur juridique. Dans le cas d’un litige par exemple, la justice peut demander la suspension provisoire du traitement normal ou de la destruction de documents d’archives. Des logiciels permettent alors de procéder à une suspension légale tout en assurant la conservation des documents quelle que soit leur forme.

    Autant dire que l’enjeu est considérable. Une organisation qui serait dans l’incapacité de restituer un document crucial s’expose à de lourdes sanctions et à des amendes particulièrement salées.

    Utilisée depuis plusieurs années aux États-Unis, la procédure de e-discovery a été convoquée en matière de procédure civile dans le cadre de la phase précontentieuse lors de litiges. Elle l’est également dans le cadre d’audits en interne ou d’enquêtes à la demande d’un tiers.

    Cette procédure s’est ensuite répandue en France au sein des filiales d’entreprises nord-américaines présentes sur notre sol. Elle prend par ailleurs tout son sens pour les organisations françaises qui sont en relation contractuelle avec les États-Unis. Les informations conservées en vue d’une éventuelle action en justice seront alors extraites via une plateforme de e-discovery. Il peut s’agir de correspondance électronique, de rapports internes, de comptes-rendus de réunions, de notes…

    enlightenedLire aussi : Droit : les deux mondes de l’e-discovery et de l’archivage électronique

    Traiter un vrac : un chantier qui ne s’improvise pas

    Bonne nouvelle pour les organisations confrontées à un problème de vrac numérique : les logiciels embarquent des fonctions de plus en plus puissantes et capables, pour certaines d’entre elles, de traiter des volumes colossaux (jusqu’à plusieurs téraoctets). Et certaines règles de nommage peuvent être automatisées, faisant gagner un temps considérable aux professionnels de la gouvernance documentaire.

    Ce dossier d’Archimag passe en revue plusieurs de ces outils et propose une approche très pratique du traitement du vrac numérique. Un chantier qui ne s’improvise pas et qui repose sur la création d’un solide plan de classement et de règles de nommage communes.

    La normalisation du vocabulaire est indispensable à la cohérence des répertoires et des fichiers (voir notre article : Traiter un vrac numérique : mode d'emploi).

    enlightenedLire aussi : Traiter un vrac numérique : mode d'emploi

    Des trois âges des archives au records continuum

    Apparue au milieu du vingtième siècle et diffusée en France par l’archiviste Yves Pérotin (1922-1981), la théorie des trois âges des archives décrit les trois périodes du cycle de vie d’un document d’archive : les archives courantes (premier âge), les archives intermédiaires (deuxième âge) et les archives définitives (troisième âge). Enseignée pendant des décennies, cette théorie est cependant critiquée en raison, notamment, de son inadaptation aux flux numériques.

    Au Québec, Yvon Lemay et Anne Klein plaident pour une nouvelle méthode autour du records continuum présenté comme « une approche ouverte, susceptible de favoriser diverses lectures, différentes interprétations. Le records continuum favorise une vision multidimensionnelle ». À leurs yeux, cette approche est plus souple et s’adapte mieux aux enjeux contemporains :

    « À la différence de la théorie des trois âges, le records continuum vise à satisfaire des usages les plus variés — dans les domaines de l’éducation, de la recherche, de la pratique professionnelle, etc. ».

    Ce débat a-t-il lieu ailleurs ? Oui, notamment en Australie et aux États-Unis. Mais pas assez dans le monde de la francophonie :

    « Malheureusement peu connue dans le monde francophone, la modélisation de ce continuum est un changement de paradigme qui permet aux professionnels de l’information de pouvoir s’adapter aux évolutions technologiques, d’être proactifs dans les organisations et de s’insérer dans les dispositifs techniques et de qualité de celles-ci », estiment les experts Gilliane Kern, Sandra Holgado et Michel Cottin (Cinquante nuances de cycle de vie. Quelles évolutions possibles ? » Les Cahiers du numérique 2015/2) :

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    vrac-numerique
    L’entassement croissant et pas toujours cohérent de documents sur les serveurs est un phénomène qui touche les entreprises comme les administrations. Quelle est l’origine de ce vrac numérique ? Comment se manifeste-t-il ? Quelle est son ampleur ? Pour faire face, à quelle théorie archivistique peut-on se rattacher ? En pratique, une méthode rigoureuse permet de le résorber. De plus, différentes sortes d’outils logiciels sont à disposition pour cette gestion. Retour d’expérience au ministère des Armées.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Le chiffre du jour
    1
    est en moyenne signalée toutes les semaines dans les établissements de santé depuis janvier 2021. Les hôpitaux ont subi 27 cyberattaques majeures - qui ont effectué tout ou partie de leurs systèmes d'information - en 2020.
    Publicité

    supplement-confiance-numerique-270500.png