Article réservé aux abonnés Archimag.com

Numérisation : sous quel format conserver les documents ?

  • numerisation_format_conservation.jpg

    numerisation-format-conservation
    PDF (ISO 32000) est un format normalisé internationalement. Disposant de visionneuses gratuites il est le format préférentiel de tout document numérisé. (Pixabay/Toomanyloginnames)
  • La dématérialisation s’impose aujourd’hui dans toutes les organisations. Beaucoup de documents sont dès lors numérisés, encore faut-il savoir sous quel format les conserver. Découvrez quels sont les formats recommandés par le Référentiel Général d’Interopérabilité version 2 (RGI) et nos conseils pour garantir la pérennité et la bonne lisibilité de vos documents, quels que soient les systèmes ou applications qui les recevront.

    Temps de lecture : 3 minutes

    mail Découvrez L'Archiviste Augmenté et Le Brief de la Démat, les newsletters thématiques gratuites d'Archimag dédiées aux archives et à la transformation numérique des organisations !

    Les formats de numérisation recommandés

    Le Référentiel Général d’Interopérabilité version 2 (RGI) recommande 5 formats utilisables pour les objets images :

    • JPEG : Joint Photographic Experts Group
    • TIFF : Tag Image File Format
    • PDF : Portable Document Format
    • GeoTIFF : Geographical Tag Image File Format
    • PNG : Portable Network Graphics

    enlightenedLire aussi : Numérisation des documents : que doit-on réellement numériser ?

    Le format JPEG

    Défini par et pour la photographie, ce format présente des inconvénients pour la numérisation de documents. Les techniques de compression utilisées par JPeg ne sont pas optimales pour le texte et ce format n’est pas multipage.

    Suggestion de solutions pour vous
    Numérisation Fidèle et Standard
    Renforcez la pérennité et l’intégrité de vos copies numériques tout en facilitant l’accès à vos données (Certifié NF 544 pour la numérisation fidèle)
    Transformation Numérique 
    aurexus_logo_2022.jpg
    AureXus vous accompagne dans vos projets de création, conversion, numérisation, enrichissement et valorisation de contenus même multilingues

    Chaque page numérisée fera l’objet d’un fichier, ce qui n’est pas confortable pour des documents importants. De plus, l’utilisation du format JPeg à la numérisation interdit quasiment tout traitement ultérieur sur l’image.

    enlightenedLire aussi : Numérisation : un comparatif pour bien choisir son prestataire

    Le format TIFF

    Ce format est couramment utilisé par les logiciels de numérisation. Il permet de créer des fichiers multipages, ce qui est intéressant pour la numérisation de documents plus ou moins volumineux.

    L’inconvénient de ce format est double :

    1. Sa pérennité dans le temps n’est pas garantie, car il n’est pas soutenu par une organisation internationale de normalisation, à l’exception de ses deux variantes qui sont des standards de la télécopie noir et blanc ou couleur, gérés par l’UIT (Union Internationale des Télécommunications) ;
    2. Les visionneuses Tiff sont des outils propriétaires, même s’il existe des logiciels gratuits comme IrfanView ou XnView et une bibliothèque open source, LibTiff.

    Il est le format privilégié pendant la phase de traitement post-numérisation des documents. Mais il est préférable de le convertir ensuite en PDF pour la conservation.

    enlightenedLire aussi : Archives : comment le patrimoine se numérise

    Le format PDF

    PDF (ISO 32000) est un format normalisé internationalement. Disposant de visionneuses gratuites il est le format préférentiel de tout document numérisé. Ceci pour les raisons suivantes :

    • Il est multipage et multi documents ;
    • Il permet d’intégrer les métadonnées documentaires, 
    • Il peut sécuriser le document électronique, 
    • Il permet la signature électronique des documents.

    La norme ISO 19005 définit un PDF Archive pour la conservation.
    Elle a 3 versions publiées et une quatrième en cours de publication :

    • La version PDF/A-1, antérieure à l’adoption de la norme Iso 32000, est basée sur la version 1.4 d’Adobe PDF. Elle ne dispose pas des technologies de compression les plus modernes ; elle ne permet pas l’encapsulation de plusieurs documents dans le PDF ;
    • La version PDF/A-2 est basée sur l’Iso 32000. C’est la version recommandée pour l’archivage. Elle peut archiver en un seul fichier un dossier de documents PDF ;
    • La version PDF/A-3 répond à un besoin spécifique d’archivage de documents d’origine numérique, lorsqu’il est souhaité de conserver le format original en plus de sa conversion en PDF ;
    • La norme Iso 32000 étant en révision pour incorporer entre autres les nouveaux formats 3D, une version PDF/A-4 est en développement.

    Note  : quel que soit la version de PDF, les documents numérisés seront pérennes, car par nature ils ne comportent pas d’éléments susceptibles d’empêcher leur lecture ultérieure.

    enlightenedLire aussi : Les 6 points clés pour numériser, gérer et valoriser son patrimoine audiovisuel

    Les formats GeoTIFF et PNG

    • GeoTiff est une standardisation particulière du format Tiff pour incorporer des données cartographiques à une image. Ceci n’a aucun intérêt pour l’image d’un document numérisé.
    • PNG est un format image, monopage et sans intérêt particulier pour la numérisation.

    Notre conseil 

    Le format privilégié pour tout document numérisé est le format PDF, quelle que soit sa version. Il garantit sa pérennité et sa bonne lisibilité quels que soient les systèmes ou applications qui le recevront.

    La quasi-totalité des numériseurs et des logiciels de numérisation savent générer ce format PDF.

    Dans sa version normalisée Iso 32000, il permet l’intégration des métadonnées associées au document numérisé et le mélange, dans le même PDF, de pages numérisées et de pages créées numériquement. Pour ces derniers cas, l’utilisation de sa restriction PDF/A est intéressante quand une conservation en archives est envisagée.

    enlightenedLire aussi : Infographie : quelles sont les pratiques de numérisation dans les organisations françaises ?

    Michel THOMAS
    Expert dématérialisation et archivage

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    vrac-numerique
    L’entassement croissant et pas toujours cohérent de documents sur les serveurs est un phénomène qui touche les entreprises comme les administrations. Quelle est l’origine de ce vrac numérique ? Comment se manifeste-t-il ? Quelle est son ampleur ? Pour faire face, à quelle théorie archivistique peut-on se rattacher ? En pratique, une méthode rigoureuse permet de le résorber. De plus, différentes sortes d’outils logiciels sont à disposition pour cette gestion. Retour d’expérience au ministère des Armées.
    Acheter ce numéro  ou  Abonnez-vous
    Ce sujet vous intéresse? Retrouvez-en davantage dans les Guides Pratiques Archimag !
    guide-archivage-hybride-electronique-durees-conservation
    Travailler “dans le cloud” n’a pas mis fin à l’usage du document papier. La question de l'archivage doit donc être abordée tant sous l’angle hybride (papier et électronique) que purement électronique. Ce guide se situe dans cette double problématique, avec le contexte d’une organisation devant gérer mobilité ou télétravail. Il montre comment répondre aux impératifs de sécurité, traçabilité et respect du cadre légal, réglementaire et normatif. En bonus : un deuxième guide contenant les durées légales de conservation de documents du secteur public ou du secteur privé. EN BONUS : Les durées légales de conservation de documents !
    Acheter ce guide  ou  Abonnez-vous
    À lire sur Archimag
    Le chiffre du jour
    1
    est en moyenne signalée toutes les semaines dans les établissements de santé depuis janvier 2021. Les hôpitaux ont subi 27 cyberattaques majeures - qui ont effectué tout ou partie de leurs systèmes d'information - en 2020.
    Publicité

    supplement-confiance-numerique-270500.png