Publicité

Numérisation : sous quel format conserver les documents ?

  • photo_scan.jpg

    scan-photo
    PDF (ISO 32000) est un format normalisé internationalement. Disposant de visionneuses gratuites il est le format préférentiel de tout document numérisé. (Pixabay/Toomanyloginnames)
  • Source : Serda Conseil 

    La dématérialisation s’impose aujourd’hui dans toutes les organisations. Beaucoup de documents sont dès lors numérisés, encore faut-il savoir sous quel format les conserver. 

    Le Référentiel Général d’Interopérabilité version 2 (RGI) recommande 5 formats utilisables pour les objets images :

    • JPEG : Joint Photographic Experts Group
    • TIFF : Tag Image File Format
    • PDF : Portable Document Format
    • GeoTIFF : Geographical Tag Image File Format
    • PNG : Portable Network Graphics

    Le format JPEG

    Défini par et pour la photographie, ce format présente des inconvénients pour la numérisation de documents. Les techniques de compression utilisées par JPEG, ne sont pas optimales pour le texte. L’utilisation du format JPEG à la numérisation interdit quasiment tout traitement ultérieur sur l’image.

    Le format TIFF

    Ce format est couramment utilisé par les logiciels de numérisation. Il permet de créer des fichiers multipages, ce qui est intéressant pour la numérisation de documents plus ou moins volumineux.
    L’inconvénient de ce format est double :

    Sa pérennité dans le temps n’est pas garantie, car il n’est pas soutenu par une organisation internationale de normalisation, à l’exception de ses deux variantes qui sont des standards de la télécopie noir et blanc ou couleur, gérés par l’UIT-(Union Internationale des Télécommunications).
    Les visionneuses TIFF sont des outils propriétaires, même s’il existe des logiciels gratuits comme IrfanView ou XnView et une bibliothèque OpenSource : LibTIFF.

    Il est le format privilégié pendant la phase de traitement post-numérisation des documents. Mais il est préférable de le convertir ensuite en PDF pour la conservation.

    Le format PDF

    PDF (ISO 32000) est un format normalisé internationalement. Disposant de visionneuses gratuites il est le format préférentiel de tout document numérisé.

    • Il est multipage et multi documents ;
    • Il permet d’intégrer les métadonnées documentaires, 
    • Il peut sécuriser le document électronique, 
    • Il permet la signature électronique des documents.

    La norme ISO 19005 définit un PDF Archive pour la conservation.
    Elle a 3 versions publiées et une quatrième en cours de publication :

    • La version PDF/A-1, antérieure à l’adoption de la norme ISO 32000, est basée sur la version 1.5 d’Adobe PDF. Elle ne dispose pas des technologies de compression les plus modernes ; elle ne permet pas l’encapsulation de plusieurs documents dans le PDF.
    • La version PDF/A-2 est basée sur l’ISO 32000. C’est la version recommandée pour l’archivage. Elle peut archiver en un seul fichier un dossier de documents PDF.
    • La version PDF/A-3 répond à un besoin spécifique d’archivage de documents d’origine numérique, lorsqu’il est souhaité de conserver le format original en plus de sa conversion en PDF. 
    • Enfin la norme ISO32000 étant en révision pour incorporer entre autres les nouveaux formats 3D, une version PDF/A-4 est en développement.

    Note  : quel que soit la version de PDF, les documents numérisés seront pérennes, car par nature ils ne comportent pas d’éléments susceptibles d’empêcher leur lecture ultérieure.

    Les fortmats GeoTIFF et PNG

    GeoTIFF est une standardisation particulière du format TIFF et PNG est un format peu pratique à utiliser pour la numérisation.

    Michel THOMAS
    MT CONSEIL

    Source : Serda Conseil

    Ce sujet vous intéresse? Retrouvez-en davantage dans les Guides Pratiques Archimag !

    Images et vidéos envahissent en permanence nos écrans. Les sources et les flux se multiplient tandis que les organisations sont confrontées à la valorisation de leurs propres fonds. Pour mener leurs projets, qu’ils soient à visée patrimoniale ou de diffusion, elles doivent imaginer de nouvelles pratiques et de nouveaux usages. Se posent alors des questions d’accès à ces contenus aux formats variés, d’identification, de conservation des supports et des appareils, de gestion des droits, d’exploitation ou réexploitation des contenus. Points techniques, avis d’expert, méthodes, outils et retours d’expérience apportent les réponses nécessaires.

    Acheter ce guide  ou  Abonnez-vous

    À lire sur Archimag

    Le Mag

    Tout Archimag, à partir de 9,50 €
    tous les mois.

    Le chiffre du jour

    34 milliards de dollars c'est la somme dépensée par la société IBM pour devenir numéro un sur le marché du cloud computing.

    Recevez l'essentiel de l'actu !

    Nouveaux membres