Article réservé aux abonnés Archimag.com

Par-delà la multiplicité des solutions de stockage

  • high-bay-408222_1280.jpg

    Les appliances de sauvegarde ne peuvent pas constituer des alternatives durables aux problématiques de protection et de préservation des données. Crédit : PixaBay
  • Du fait de la dissociation entre l'information et son support, la question des infrastructures de stockage reste définitivement une problématique majeure. Est-ce une bonne approche ?

    La valeur probante d'un document ne tient plus à la nature du support sur lequel il est conservé (la nature "Worm physique" du support imposée dans les premières versions de la norme NF Z42-013 a disparue) ! Parfait, nous sommes enfin sortis de l'âge de la pierre. Pour autant y a-t-il des exigences particulières qu'il faut conserver au niveau des supports physiques ? Ou bien faut-il laisser définitivement au "monde du logiciel", les clés de l'authenticité, de la pérennité et de l'intégrité.

    C'est de toute évidence la tendance avec le cloud, qui magnifie cette démarche au point de ne même plus savoir où sont effectivement les informations. Et qui, en fait, ne fait que repousser la question et la reporter momentanément vers les data centers.

    De quelles alternatives disposent les DSI ?

    Les infrastructures de stockage se partagent, d'une part, entre les moyens très performants permettant de répondre aux fortes exigences opérationnelles du système d'information (SI) et, d'autre part, l'ensemble des moyens dédiés aux sauvegardes et à la conservation à long terme des informations, à leur sécurisation et à leur préservation. Traditionnellement les termes “chaud”, ”tiède” et “froid” sont utilisés pour designer ces différents niveaux d'exigences.

    1. Quelle stratégie est la plus efficace ?

    Les stratégies de sauvegarde mettent en application depuis longtemps des approches rigoureuses pour sécuriser les données sur supports primaires (chaud), vers des supports secondaires, disques ou bandes magnétiques (tiède et froid) et maintenant en externalisant les copies (comme le glacier d'Amazon, très froid en effet).

    Cette stratégie trouve ces limites aujourd'hui avec l'accroissement exponentiel des données qui rendent les fenêtres de sauvegarde totalement ingérables. Du coup les solutions de sauvegarde évoluent vers davantage de sophistication : 

    • déduplication à la source pour réduire les effets de la multiplicité des fichiers sources ;
    • sauvegarde en continu, pour retrouver une certaine maîtrise des opérations ;
    • appliance de sauvegarde.

    Les évolutions apportées par les appliance sont également d'ordre pratique avec leur mise en œuvre facilitée sinon immédiate (plug and play). Elles réduisent notablement les réflexions et tâches laborieuses pour construire le SI, élément par élément (logiciels de sauvegardes, HSM, supports, réseau…) et pour le maintenir dans le temps.

    L'étude IDC de mars 2014 sur la protection des données signale effectivement l'accroissement significatif du recours aux appliances de sauvegarde par les entreprises sur le marché EMEA.

    Cette étude pointe les très nombreux avantages d'un recours à ces appliances de sauvegarde. Malheureusement, il n'est pas fait de comparatif entre l'efficacité respective des stratégies de sauvegarde et d'archivage au regard des "contenus fixes" qui encombrent à 80% les volumétries en question.

    La gestion et la préservation des "contenus fixes" ne seront jamais des questions de sauvegarde, ni de HSM (outils de migration de fichiers permettant, sur la base de critères simples d'automatiser le transfert et la copie des fichiers sources depuis des supports primaires vers des supports de stockage secondaires, moins coûteux. La restitution des fichiers étant immédiate via l'utilisation des "stubs"), mais belle et bien des problématiques à traiter en amont, pour identifier ce qui constitue des archives et distinguer : 

    • d'une part, la sauvegarde des environnements opérationnels ;
    • d'autre part, la gestion du cycle de vie des données et leur préservation.

    Au final, les appliances de sauvegarde ne peuvent pas constituer des alternatives durables aux problématiques de protection et de préservation des données. Elles doivent rester sur leur domaine, celui de la sauvegarde des environnements opérationnels.

    Confusion entre sauvegarde et archivage

    Il n'est pas rare d'être confronté aux pratiques d'exploitants informatiques où les supports de sauvegarde (bandes en général) sont conservés sur des périodes très longues afin de constituer officiellement des archives. Ceci démontre de fait un besoin non couvert.

    2. Le foisonnement des appliances de sauvegarde et d'archivage

    Face aux appliances de sauvegarde, qui sont récentes, les appliances d'archivage ont vu le jour au début des années 2000 avec les Centera d'EMC, l'objectif étant de proposer des supports réputés Worm, au lieu des supports optiques définitivement hors de course, pour la préservation à long terme.

    Aujourd'hui, le marché des appliances d'archivage s'est notablement développé avec des offres par tous les constructeurs : IBM, Nettapps, HDS, Nexsan et autres Fast LTA. Les solutions sont de plus en plus sophistiquées, avec des logiciels embarqués qui prennent largement le pas sur des fonctionnalités de gestion documentaire ou de gestion d'archives.

    L'approche initiale était de rendre Worm, donc non réinscriptibles, des supports de stockage magnétiques qui ne le sont pas par définition, et ainsi assurer l'intégrité des données ou des documents. Mais seulement l'intégrité !

    Aujourd'hui, les appliances disponibles sur la marché ont entamé une fuite en avant des fonctionnalités : gestion des durées de conservation, signatures, cryptages… tout en conservant des interfaces basiques de type HSM.

    Ce que l'on conçoit facilement en termes d'optimisation et d'efficacité pour les appliances de sauvegarde (déduplication, compression), ne se conçoit plus pour une appliance d'archivage.

    La multiplicité des appliances de sauvegarde peut se justifier et se gérer au sein d'une DSI car les besoins peuvent être circonscrits et limités, voire disposer ainsi d'une plus grande agilité pour s'adapter et faire évoluer les moyens de sauvegarde. Il en va tout autrement en termes d'archivage et de préservation à long terme. Le long terme impose en effet une vision globale, transversale, dans le temps, qui s'accommode mal de la multiplicité des appliances !

    3. De quel support a-t-on besoin pour l'archivage ?

    Les besoins d'archivage proviennent : 

    • d'une part, de la gestion structurée, en conformité aux principes du records management, des documents et des données aux niveaux des applications métiers ;
    • d'autre part, des environnements collaboratifs et des moyens bureautiques mis à la disposition des personnels.

    Dans le premier cas, les infrastructures de stockage nécessaires sont un des composants d'un dispositif de préservation large et doivent a minima venir renforcer les fonctionnalités apportées par les SAE, système d'archivage électronique, à valeur probante ou non, en particuliers en termes : 

    • d'intégrité (fonction Worm ou interface de type SnapLock) ;
    • de pérennité (supports non propriétaires avec accès simple et immédiat sans API) ;
    • d'évolutivité (accroissement des capacités, sans migration et reconfiguration) ;
    • et des réplications (sécurisation multisite facilitée).

    Dans le second cas, les infrastructures de stockage (à défaut d'un environnement applicatif documentaire large en amont) doivent apporter en plus, au travers des appliances d'archivage, les fonctionnalités neutres et ouvertes pour distinguer et gérer les contenus fixes autrement qu'avec la seule date de modification, et sortir des fonctions HSM qui ne font que reporter les échéances.

    4. Pour un travail de normalisation

    Un travail de normalisation pourrait être avantageusement efficace en matière de préservation des données en poursuivant le travail commencé avec la norme Iso 14721 OAIS et en définissant techniquement et fonctionnellement l'interface entre le SAE et les supports de stockage (la virtualisation du stockage à long terme).

    C'est un champ de réflexion qui a été abandonné aux constructeurs, avec de fait un foisonnement des offres, mais qui pourrait s'inscrire dans la démarche VNA, vendor neutral archive, connue dans le médical, par exemple.

     

    Jacques Leret

    DG d'Opus Technologies International

     

     ___________________________________________________________________________________________________________________________

    +repères

    Un cadre spécifique  –  révision de la norme 15489

    Les premières versions de la norme s'attachaient à présenter les exigences du records management, plus particulièrement au niveau de l'étape finale de conservation et de l'archivage des documents. Faisant naître à cette occasion un dilemme pour traduire le terme "records" vs celui "archives". Aujourd'hui la révision en cours de la norme propose un texte qui se rapproche significativement de la norme Iso 30300 avec une vision globale des exigences et avec une véritable approche en tant que "système de management" comme l'Iso 9000 ou 14000, et donc avec une certification à la clé.

    Cette approche globale (celle de la norme 30300) est salutaire dans la mesure où elle fournit les outils pour élaborer une véritable "MOA documentaire" et plus généralement une gouvernance de l'information pouvant être sanctionnée par une certification. Enfin, on pourra parler de "compliance", en s'appuyant sur un référentiel d'exigences et des objectifs clairs.

    Aujourd'hui, seul l'archivage est susceptible d'une Certification NF461 et les conditions de cette conformité restent fragiles, soumises aux multiples interprétations de la norme Z42-013, qui ne couvre que l'étape finale, l'archivage, imposant ainsi implicitement des contraintes en amont qui sortent du champ de vision de la certification.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !

    Au sommaire de ce numéro

    - Baromètre emploi : Archimag met la pression !
    - Big data, big ECM ?
    - Par delà la multiplicité des solutions de stockage
    - Feuilletez tout Archimag en ligne

    DOSSIER : La Ged s'habille en collaboratif

    Tandis que se multiplient les services web de communication et de partage de contenus, les éditeurs embarquent de plus en plus de fonctionnalités de partage et de travail collaboratif dans les solutions de Ged. Certains font aussi le choix de jeter de nouveaux ponts avec les systèmes extérieurs, notamment les réseaux sociaux et les services cloud ou multiplient les ports avec d'autres solutions. 

    Et aussi :
    - Logiciels pour bibliothèques : un marché morose
    - Le logiciel documentaire pour tous
    - APF Entreprises, l'autre prestataire en numérisation
    - La numérisation en bibliothèque : quels droits pour quelles oeuvres ? - 2/2
    - Favoris : créer des questionnaires en ligne
    - Portrait : Lourdes Fuentes Hashimoto, bâtisseuse de passerelles 
    - Ali Laïdi : "l'intelligence économique est une vision et une grille d'analyse politique du monde"
    - Permettre aux jeunes d'être entrepreneurs de leur vie
    - Archimagstore : applis, cadeaux, beaux livres, expos...
    - Archi... kitsch : dans les archives d’Archimag, mars 1995

    Acheter ce numéro  ou  Abonnez-vous

    À lire sur Archimag

    Le Mag

    Tout Archimag, à partir de 9,50 €
    tous les mois.

    Le chiffre du jour

    76
    des répondants à notre grande enquête sur les professionnels de l'information et l'entrepreneuriat affirment être attirés par le statut d’entrepreneur (créateur d’entre-prise, indépendant, freelance, etc.).

    Recevez l'essentiel de l'actu !

    Indispensable

    Bannière BDD.gif