Article réservé aux abonnés Archimag.com

Numérisation : sous quel format conserver les documents ?

  • numerisation_format_conservation.jpg

    numerisation-format-conservation
    PDF (ISO 32000) est un format normalisé internationalement. Disposant de visionneuses gratuites il est le format préférentiel de tout document numérisé. (Pixabay/Toomanyloginnames)
  • La dématérialisation s’impose aujourd’hui dans toutes les organisations. Beaucoup de documents sont dès lors numérisés, encore faut-il savoir sous quel format les conserver. Découvrez quels sont les formats recommandés par le Référentiel Général d’Interopérabilité version 2 (RGI) et nos conseils pour garantir la pérennité et la bonne lisibilité de vos documents, quels que soient les systèmes ou applications qui les recevront.

    Temps de lecture : 3 minutes

    mail Découvrez L'Archiviste Augmenté et Le Brief de la Démat, les newsletters thématiques gratuites d'Archimag dédiées aux archives et à la transformation numérique des organisations !

    Les formats de numérisation recommandés

    Le Référentiel Général d’Interopérabilité version 2 (RGI) recommande 5 formats utilisables pour les objets images :

    • JPEG : Joint Photographic Experts Group
    • TIFF : Tag Image File Format
    • PDF : Portable Document Format
    • GeoTIFF : Geographical Tag Image File Format
    • PNG : Portable Network Graphics

    enlightenedLire aussi : Numérisation des documents : que doit-on réellement numériser ?

    Le format JPEG

    Défini par et pour la photographie, ce format présente des inconvénients pour la numérisation de documents. Les techniques de compression utilisées par JPeg ne sont pas optimales pour le texte et ce format n’est pas multipage.

     

    Suggestion de solutions pour vous
    Numérisation Fidèle et Standard
    Renforcez la pérennité et l’intégrité de vos copies numériques tout en facilitant l’accès à vos données (Certifié NF 544 pour la numérisation fidèle)
    Transformation Numérique
    AureXus vous accompagne dans vos projets de création, conversion, numérisation, enrichissement et valorisation de contenus même multilingues
    ScanCenter : L’atelier de numérisation
    ScanCenter est au service de votre transformation numérique : numérisation et impression tous formats et mise à disposition sur un espace sécurisé.

     

    Chaque page numérisée fera l’objet d’un fichier, ce qui n’est pas confortable pour des documents importants. De plus, l’utilisation du format JPeg à la numérisation interdit quasiment tout traitement ultérieur sur l’image.

    enlightenedLire aussi : Numérisation : un comparatif pour bien choisir son prestataire

    Le format TIFF

    Ce format est couramment utilisé par les logiciels de numérisation. Il permet de créer des fichiers multipages, ce qui est intéressant pour la numérisation de documents plus ou moins volumineux.

    L’inconvénient de ce format est double :

    1. Sa pérennité dans le temps n’est pas garantie, car il n’est pas soutenu par une organisation internationale de normalisation, à l’exception de ses deux variantes qui sont des standards de la télécopie noir et blanc ou couleur, gérés par l’UIT (Union Internationale des Télécommunications) ;
    2. Les visionneuses Tiff sont des outils propriétaires, même s’il existe des logiciels gratuits comme IrfanView ou XnView et une bibliothèque open source, LibTiff.

    Il est le format privilégié pendant la phase de traitement post-numérisation des documents. Mais il est préférable de le convertir ensuite en PDF pour la conservation.

    enlightenedLire aussi : Archives : comment le patrimoine se numérise

    Le format PDF

    PDF (ISO 32000) est un format normalisé internationalement. Disposant de visionneuses gratuites il est le format préférentiel de tout document numérisé. Ceci pour les raisons suivantes :

    • Il est multipage et multi documents ;
    • Il permet d’intégrer les métadonnées documentaires, 
    • Il peut sécuriser le document électronique, 
    • Il permet la signature électronique des documents.

    La norme ISO 19005 définit un PDF Archive pour la conservation.
    Elle a 3 versions publiées et une quatrième en cours de publication :

    • La version PDF/A-1, antérieure à l’adoption de la norme Iso 32000, est basée sur la version 1.4 d’Adobe PDF. Elle ne dispose pas des technologies de compression les plus modernes ; elle ne permet pas l’encapsulation de plusieurs documents dans le PDF ;
    • La version PDF/A-2 est basée sur l’Iso 32000. C’est la version recommandée pour l’archivage. Elle peut archiver en un seul fichier un dossier de documents PDF ;
    • La version PDF/A-3 répond à un besoin spécifique d’archivage de documents d’origine numérique, lorsqu’il est souhaité de conserver le format original en plus de sa conversion en PDF ;
    • La norme Iso 32000 étant en révision pour incorporer entre autres les nouveaux formats 3D, une version PDF/A-4 est en développement.

    Note  : quel que soit la version de PDF, les documents numérisés seront pérennes, car par nature ils ne comportent pas d’éléments susceptibles d’empêcher leur lecture ultérieure.

    enlightenedLire aussi : Les 6 points clés pour numériser, gérer et valoriser son patrimoine audiovisuel

    Les formats GeoTIFF et PNG

    • GeoTiff est une standardisation particulière du format Tiff pour incorporer des données cartographiques à une image. Ceci n’a aucun intérêt pour l’image d’un document numérisé.
    • PNG est un format image, monopage et sans intérêt particulier pour la numérisation.

    Notre conseil 

    Le format privilégié pour tout document numérisé est le format PDF, quelle que soit sa version. Il garantit sa pérennité et sa bonne lisibilité quels que soient les systèmes ou applications qui le recevront.

    La quasi-totalité des numériseurs et des logiciels de numérisation savent générer ce format PDF.

    Dans sa version normalisée Iso 32000, il permet l’intégration des métadonnées associées au document numérisé et le mélange, dans le même PDF, de pages numérisées et de pages créées numériquement. Pour ces derniers cas, l’utilisation de sa restriction PDF/A est intéressante quand une conservation en archives est envisagée.

    enlightenedLire aussi : Infographie : quelles sont les pratiques de numérisation dans les organisations françaises ?

    Michel THOMAS
    Expert dématérialisation et archivage

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    vrac-numerique
    L’entassement croissant et pas toujours cohérent de documents sur les serveurs est un phénomène qui touche les entreprises comme les administrations. Quelle est l’origine de ce vrac numérique ? Comment se manifeste-t-il ? Quelle est son ampleur ? Pour faire face, à quelle théorie archivistique peut-on se rattacher ? En pratique, une méthode rigoureuse permet de le résorber. De plus, différentes sortes d’outils logiciels sont à disposition pour cette gestion. Retour d’expérience au ministère des Armées.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.
    Publicité

    supplement-confiance-numerique-270500.png