Article réservé aux abonnés Archimag.com

Archivage : où en est le PDF/A ?

  • cadenas_portes.jpg

    cadenas-porte
    Les prochains développements seront exposés à l’occasion des PDF Days Europe 2017 qui se tiendront à Berlin en mai 2017. (Photo via Visualhunt.com)
  • Moins connu que le format PDF utilisé par les internautes du monde entier, le format PDF/A vise à garantir une conservation à long terme des documents électroniques. Recommandé - sous certaines conditions - par l'État, il est également utilisé dans le secteur privé.

    barros-PDFATout le monde connaît le format PDF. Le terme est passé dans le langage courant au point de devenir un mot de tous les jours qui n'est plus réservé aux seuls informaticiens. Il faut dire que la célèbre extension .pdf ne manque pas d'atouts : ce format préserve les polices de caractères, les images, les objets graphiques et la mise en forme à l'identique du document original.

    Mais qui connaît le PDF/A ? Il s'agit de la version standardisée Iso (Organisation internationale de normalisation) du PDF. Ce qui le place d'emblée dans une perspective d'archivage et de conservation à long terme des documents électroniques.

    C'est en 2005 que l'Organisation internationale de normalisation a adopté la norme PDF/A. À l'époque, elle évoquait les promesses du nouveau format : « La norme permettra aux bibliothèques, archives et autres consommateurs de ressources électroniques d'encourager leurs fournisseurs de contenu à produire et à fournir leurs ressources sous une forme optimisée, offrant des garanties pour une conservation efficace à long terme ». Outre-Atlantique, les autorités en charge de l'archivage étaient tout aussi enthousiastes : « Les fichiers PDF/A seront plus autonomes, autodescriptifs et indépendants du type d'ordinateur que les fichiers génériques PDF1.4 et ils devraient permettre de conserver les informations plus longtemps ».

    Fortes contraintes réglementaires

    Une décennie plus tard, le PDF/A trace sa route au rythme des différentes révisions de l'Iso : PDF/A-1 en 2005, PDF/A-2 en 2011 et PDF/A-3 en 2012.

    La première version (PDF/A-1) avançait un certain nombre de conditions relatives à la reproduction fiable de l'aspect visuel d'un document et exigeait des garanties en termes d'accessibilité du document. La deuxième version (PDF/A-2), publiée six ans plus tard, proposait de nouvelles fonctionnalités portant sur la compression d'image, la signature électronique et l'intégration de polices OpenType codéveloppées par Adobe et Microsoft. Quant à la troisième version, apparue seulement un an après la précédente, elle modifiait un seul aspect, mais par n'importe lequel puisqu'il s'agissait d'incorporer des formats de fichiers abondamment utilisés comme le XML, le CSV ou le CAD.

    Toutes versions confondues, l'objectif reste le même depuis plus de douze ans : face à la nécessité d'archiver des documents électroniques toujours plus nombreux, il faut un format capable de préserver leur contenu sur le long cours. Cet impératif documentaire concerne bien évidemment les institutions documentaires (bibliothèques, archives, services de documentation...), mais aussi les secteurs juridiques ou industriels qui doivent répondre à de fortes contraintes réglementaires. 

    Le PDF/A met en avant sa dimension « autonome » qui lui permet d'intégrer toutes les informations utiles au coeur même du fichier. Il n'est donc pas dépendant de sources externes. En revanche, de nombreuses restrictions viennent assombrir le tableau. Il n'est notamment pas possible d'insérer des fichiers dynamiques de type audio ou vidéo. Il n'est pas non plus possible de greffer un système de chiffrement. Même régime d'interdiction pour les lancements de code script ou de fichiers exécutables. Par contre, l'utilisation de métadonnées standard est obligatoire. 

    Dans l'administration, dans les entreprises

    En France, l'administration est tenue d'utiliser des formats informatiques consignés dans un référentiel général d'interopérabilité (RGI). Ce document, élaboré par le secrétariat général pour la modernisation de l'action publique (SGMAP), fixe les normes et préconise un certain nombre de bonnes pratiques informatiques au sein de l'administration. Parmi les standards retenus par ce RGI, le PDF/A figure en bonne place dans le segment de l'interopérabilité syntaxique, mais il est assorti d'un sérieux avertissement : « L'usage du PDF/A-3 est fortement déconseillé, car il peut encapsuler des formats binaires non maîtrisés ». Le PDF/A est cependant recommandé pour d'autres usages : profils d'interopérabilité, archivage...

    Au-delà de l'administration, les entreprises sont également invitées à utiliser le PDF/A. « De nombreuses entreprises gardent des copies papier des documents. Des microfiches et des microfilms sont aussi utilisés comme méthode d’archivage. Le PDF/A est destiné à remplacer toutes ces méthodes d’archivage avec un seul format normalisé facile à mettre à jour, consultable, facile à organiser, efficace, portable et surtout, autonome. Cela signifie une solution peu coûteuse et peu encombrante pour remplacer les piles de papier et de dossiers que vous gardez », explique l'éditeur spécialisé Solid Document.

    Certains secteurs ont déjà franchi le pas. C'est le cas notamment, en aéronautique, du constructeur Airbus qui génère depuis plusieurs années déjà des fichiers PDF/A afin de conserver la documentation technique de construction de l'Airbus A 380. 

    Le monde hospitalier s'est également converti, à l'image des hôpitaux du canton de Vaud (Suisse) qui l'utilisent pour conserver l'ensemble des documents relatifs à chaque patient. Les documents archivés proviennent de différentes applications (bureautiques, médicales...) et sont convertis au format PDF/A avant d'être injectés dans le système d'archivage.

    En 2018, l'emblématique format PDF célébrera son vingt-cinquième anniversaire. Sa date de naissance remonte précisément au 15 juin 1993 sous le nom d’Adobe Acrobat 1.0. Son petit frère, le PDF/A poursuit sa croissance sous les auspices du PDF/A Competence Center qui regroupe des éditeurs et des spécialistes du document électronique. Les prochains développements seront exposés à l'occasion des PDF Days Europe 2017 qui se tiendront à Berlin les 15 et 16 mai prochains.

    + repères

    A, X, H ou VT, une galaxie de formats PDF

    À côté des PDF et des PDF/A, il existe d'autres formats estampillés PDF. À commencer par le PDF/X dédié aux fichiers PDF utilisés pour l'impression. Créé en 1998, il vise à fiabiliser les échanges documentaires dans le domaine de la préimpression.

    Le PDF/H quant à lui est utilisé dans le domaine médical. Encadré par une norme Iso, il concerne l'utilisation des fichiers PDF comme conteneur numérique sécurisé pour la gestion des informations numériques dans le monde hospitalier. Basé sur le PDF 1.7 (Iso-32000), le PDF/H doit respecter un ensemble de règles destinées à simplifier l'archivage et les échanges de données numériques notamment l'imagerie médicale.

    Autre variante, le PDF/VT est une norme internationale (Iso 16612-2) qui a pour objectif de proposer un format d'échange adapté aux besoins de l'éditique. Notons également l'existence d'un PDF/E plus particulièrement adapté à l'échange de documents et la collaboration dans le domaine de l'ingénierie.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !

    archimag-302
    Aujourd’hui, lorsque l’on associe paperless - zéro papier - à espace de travail, on ne pense plus tant dématérialisation que rationalisation permise, ou poussée, par le digital. C’est un mouvement qui touche de plus en plus les organisations...
    Acheter ce numéro  ou  Abonnez-vous

    À lire sur Archimag

    Le Mag

    Tout Archimag, à partir de 9,50 €
    tous les mois.

    Le chiffre du jour

    C'est le nombre de personnes que le gouvernement souhaite former au numérique dans les prochaines années.

    Recevez l'essentiel de l'actu !