Processus d'archivage, un pas de plus dans la démat

Michel Jacobson DR

 

Avec le standard d'échange de données pour l'archivage (Seda), à l'image de la dématérialisation des processus dans différents métiers, les Archives de France ont jeté les fondements d'une dématérialisation pour les processus d'archivage. La version 1.0 vient d’être publiée.

 

historique et périmètre

La dématérialisation au sens du Seda, s’intéresse aux versements ou encore aux communications, éliminations ou restitutions d'archives. Le Seda est le résultat d'une collaboration lancée dès 2006 entre les archives de France (1) et la direction générale de la modernisation de l’État (DGME) dans le cadre de l'action 103 de l'ancien programme d'administration électronique (Adele). Il est aujourd'hui avec le document Politique et pratiques d'archivage – sphère publique (P2A) élaboré en collaboration entre la Daf, la DGME et l'ancienne DCSSI (2), un des référentiels inscrit dans le référentiel général d'interopérabilité. 
Tout commence en 2004, lorsque les archives de France étudient avec une filiale de la Caisse des dépôts et consignations un mode automatisable de versement aux Archives départementales des Yvelines d'actes soumis au contrôle de légalité. L'objectif principal était de proposer, au travers d'un modèle générique et réutilisable, un formalisme permettant de faciliter l’interopérabilité entre le système d’information d'un service d’archives et les systèmes d'information de ses partenaires (producteurs, utilisateurs...) dans le cadre de leurs échanges de données. 
Ainsi le standard peut être utilisé pour interconnecter des machines qui vont s'échanger des flux sans intervention humaine. Il peut aussi être utilisé sur des machines non connectées afin de produire automatiquement des messages (par exemple le bordereau de transfert ou la demande d'élimination). Ces messages pourront s'échanger ensuite sous forme de livraison de support ou de dépôt sur un serveur par un opérateur humain. Enfin le Seda peut être utilisé par les machines pour effectuer des contrôles automatiques de bonne formation, de complétude et de respect des accords qui ont été passés en amont des versements (par exemple, formats et codage des données, qualité des bordereaux, empreintes et signatures électroniques). 

le modèle

modélisation des échanges
Le standard propose une modélisation des transactions pouvant intervenir entre un service d'archives et ses partenaires. Chacune de ces transactions "métier" est modélisée suivant le standard UML (cas d'utilisation, diagrammes de séquence, diagrammes de classes). 
La plupart des transactions fait intervenir au moins deux acteurs : le service d'archives et, suivant les cas, le service producteur (pour une restitution), le service versant (pour un transfert), le demandeur (pour une communication). Certaines transactions font intervenir parfois un troisième ou quatrième acteur afin d'obtenir son autorisation (par exemple pour une élimination nécessitant le visa d'une autorité de contrôle).

modélisation des archives
Lorsqu'une archive est échangée dans un message, dans le but d'en transférer la responsabilité de sa conservation (transfert, restitution) ou bien d'en faire connaître le contenu (communication, demande d'autorisation), l'ensemble des informations qui la compose est véhiculé. Ces informations dans le modèle OAIS (3) sont réparties de manière macroscopique entre les catégories "objet de données", "informations de pérennisation" et "information d'empaquetage".
- L'objet de données sera donc soit le support traditionnel, soit des données numériques accompagnées de leur "information de représentation", c'est-à-dire de toutes les informations nécessaires à leur interprétation. Le Seda prévoit à cet effet des propriétés : par exemple type MIME, format, encodage, etc.
- Les informations de pérennisation sont représentées dans les diagrammes de classes par des propriétés que l'on peut retrouver dans d'autres modèles de description archivistique comme l'EAD (4).
- Enfin, les informations d'empaquetage, c'est-à-dire la manière dont toutes ces informations sont groupées, sont précisées par des schémas XML. Le Seda propose ainsi deux formes de paquets identifiées dans le modèle OAIS comme le "paquet d'informations à verser" (5) et le "paquet d’informations diffusé" (6).
Le Seda ne modélise l’information que dans le cadre de son échange entre un service d’archives et ses partenaires, et donc ne précise pas la manière dont il convient d’organiser l’information au sein du service d’archives (le "paquet d'information archivé") (7)

la mise en œuvre

Depuis sa création, le Seda a progressivement été mis en œuvre dans différents contextes. Des applications de production l'ont mis en place dans leurs modules d'exports et d'éliminations (par exemple dans le domaine social, ou encore par des éditeurs de Ged très utilisés dans les administrations). Des tiers de télétransmission (contrôle de légalité, flux comptables Helios...) l’ont mis en œuvre pour leurs transferts. Il est enfin utilisé par des éditeurs de logiciels d'archives pour les services publics d'archives élargissant ainsi leur périmètre à la prise en compte des archives numériques ou dans le cadre du développement spécifique de briques logicielles pour l'archivage numérique notamment à destination des collectivités territoriales.
Enfin un certain nombre de tiers-archiveurs dans le cadre de l'agrément des archives de France pour la conservation d'archives publiques numériques courantes et intermédiaires, ont également mis en œuvre le Seda. 
De ce point de vue, le Seda a atteint son objectif d'interopérabilité. 

deux révisions

Fort des retours d'expériences de ces différentes mises en œuvre, le standard a déjà fait l'objet de deux révisions, dont la dernière en date de septembre 2012 a abouti à la version 1.0. Ces différentes révisions s'accompagnent d'outils, de documentation, de formations, d’explications et d’exemples de code pour faciliter son adoption et sa mise en œuvre.

les perspectives

Le Seda constitue aujourd'hui un élément de structuration fort pour les services qui l’utilisent dans la mesure où notamment le formalisme utilisé permet, à travers la validation, de contrôler finement les échanges, les objets qui sont échangés et une partie des accords établie dans les conventions entre les services qui échangent des données. 
Pour consolider ces apports, les archives de France ont travaillé et continuent à œuvrer dans trois directions :
1 - Du point de vue de la gouvernance du standard, un comité de pilotage a été mis en place regroupant différents acteurs représentant des services publics d'archives et dans certains cas leurs services informatiques, des tiers-archiveurs, des éditeurs de logiciels d'archives, des éditeurs de logiciels métier, tous identifiés comme ayant déjà une expérience de la mise en œuvre du Seda. Ce comité a pour mission de proposer et d'évaluer les propositions d'évolution du standard.
2 - Du point de vue de l'outillage, de nouveaux outils ont été développés pour faciliter le passage d'une ancienne version du Seda à une plus récente ou encore la transformation de messages Seda en instruments de recherche formatés en EAD ou en page web formatées en HTML. Un Schematron est venu compléter la panoplie des schémas permettant ainsi d'affiner la validation. Enfin un outil a été spécialement conçu pour aider à la création de modèles de description associés à une typologie d'archives - les profils - (Agape). L'ensemble de ces informations est accessible sur le site web des archives de France. Les sources de l'outil Agape sont, elles, déposées sur la forge de l'Adullact.
3 - Une démarche de normalisation vient de commencer en cette fin d'année 2012 à l'Afnor dans le cadre de la commission de normalisation sur l'interopérabilité technique (CN4). Ce travail de normalisation permettra de donner une stabilité à ce standard. C'est aussi l'occasion de mettre en place un mode de gouvernance dans lequel l’ensemble des acteurs du marché peuvent spécifier et orienter la norme pour une meilleure adaptation aux besoins.

Michel Jacobson
[Siaf, sous-direction de la politique interministérielle et territoriale pour les archives traditionnelles et numériques, bureau des traitements et de la conservation, chef de projet sur l'archivage électronique]

 

(1) Anciennement Direction des archives de France (Daf) et actuellement Service interministériel des archives de France (Siaf).

(2) Aujourd'hui Agence nationale pour la sécurité des systèmes d'information (Anssi).

(3) OAIS : Open archival information system.

(4) EAD : Encoded archival description.

(5) Submission information package ou SIP (terminologie OAIS).

(6) Dissemination Information Package ou DIP (terminologie OAIS).

(7) Archival Information Package ou AIP (terminologie OAIS).

 

 

Les podcasts d'Archimag
Saison 2, Ép. 9 - Sommes-nous devenus accros aux algorithmes ? Aux recommandations de nos réseaux sociaux ou encore aux IA génératives qui se démocratisent depuis plus d'un an ? Pour répondre à cette question, nous avons rencontré Luc de Brabandère. Il se définit comme un philosophe d’entreprise, un mathématicien, un professeur, mais aussi un heureux grand-père et un Européen convaincu. Ses multiples casquettes nourrissent ses divers travaux. Luc de Brabandère est notamment l'auteur de "Petite Philosophie des algorithmes sournois", publié aux éditions Eyrolles en octobre 2023. Pour le podcast d'Archimag, il nous livre ses réflexions sur les algorithmes et revient sur son parcours atypique.