Ged et gestion de contenu : docomment ?

 

De statique, il est devenu dynamique ; on y a séparé le fond de la forme ; il s’adapte à tous les canaux de diffusion. De Ged en gestion de contenu, le document n’est décidément plus ce qu’il était !

 Le documenti est - et doit rester - au cœur du métier des documentalistes. Depuis toujours, le document a été un "objet" avec un contenu figé sur un support. Les pratiques professionnelles autour du document (manipulation de support, contenus inscrits, catalogues…) se sont longtemps situées dans ce contexte historique. Puis, dans la continuité du document "objet", les évolutions techniques des années 60, avec l'arrivée des logiciels documentaires, ont permis aux documentalistes de décrire leur contenu de façon formalisée dans une notice(ou bordereau ou enregistrement ou grille de saisie...) Ensemble structuré des champs et des informations constituant les références d'un document">i bibliographique.
Puis le document "numérique" est arrivé. Une première génération de Gedi (Gestion électronique de documents) a enrichi la gestion documentairei classique d'une nouvelle fonction : "associer" le document sous sa forme numérique à sa notice descriptive. A la dimension documentaire, s'est ajoutée la dimension organisationnelle : la recherche et la consultation d'un document numérique, toujours disponible, se fait à l'écran ; on peut le récupérer, le modifier pour son propre usage ou pour son collectif de travail, le supprimer, mais, surtout, on le partage ! Une nouvelle terminologie, reflétant ces nouvelles fonctions - et donc de nouvelles compétences à acquérir - apparaît dans le monde de la documentationi : acquisition numérique, numérisation, OCR (Reconnaissance optique de caractères), formats de fichieri, statut d'un document, workflowi, travail collaboratif, stockage de documents, etc.
Au fil des années, les dimensions organisationnelles, économiques, voire patrimoniales du processus documentaire sont devenues de véritables enjeux stratégiques pour les entreprises et les organisations : la mise à disposition de documents dans un environnement de travail n'est plus "restreinte" au seul centre de ressourcesi documentaire, mais s'ouvre à l'organisme tout entier ; l'informationi se partage. Doù la nécessité de pouvoir gérer dans son système de Ged certaines propriétés du document autour de ce qu'on peut appeler sa "traçabilité" : cycle de vie, métadonnées, gestion des droits, etc.
Mais voilà qu'une nouvelle ère arrive avec une panoplie de plus en plus importante d'outils de communication à la disposition des entreprises. Toujours les plaquettes, les journaux d'entreprise, les rapports d'activité, les documents techniques sur le support papier ; mais aussi leur déclinaison webi en intraneti, Internet">i, extranet. Et maintenant, XXIe siècle oblige, le téléphone mobile et les agendas électroniques (PDAi). Une autre forme de rediffusion des données voit le jour : la réutilisation dans des bases de connaissances destinées à des centres d'appel virtuels. L'entreprise a à faire face à un véritable challenge si elle veut éviter la multiplication des filières de production de documents, la perte de productivité et surtout le risque d'incohérence dans sa communication (informations différentes d'un support à l'autre). Les mutations technologiques enregistrées dans les différents processus de production (documentaires, web, éditoriaux, etc.), jusque-là parallèles, vont devoir converger. Mais derrière ces technologies, ce sont aussi des métiers différents qu'il va falloir rapprocher et faire travailler en réseau. Il ne s'agit plus de "recopier" sur écran un texte mis en page agréablement avec de la PAO, ni d'éditer sur papier un contenu web. Le point de convergence de ces technologies semble bien être le "document" dont il va falloir intégrer la production dans un système global de gestion de l'informationi. Les guillemets s'imposent : le mot a changé de sens ! D'ailleurs les réflexions sur le "document" sont très riches et la multiplicité des définitions/approches montre que c'est devenu un sujet d'étude à part entière. 
" Il ne faut pas voir la réalité telle que je suis " disait Paul Eluard (" A toute épreuve ", Paul Eluard, 1930). Le poète a toujours raison ! Que sait-on de ce qu'on voit à la consultation d'une information sur l'Internet ou en regardant une plaquette ? Que sait-on de la réalité de sa réalisation ? Avec quelle technique de production ? Est-ce un document mort, un document vivant, c'est-à-dire peut-on le mettre à jour sans recommencer toute la mise en page, si c'est du papier ou la mise en scène, si c'est du web ? La structure visuelle répond-elle à une structure logique, issue d'un codagei informatique ? Gérer le contenu d'un document, c'est s'intéresser à sa structure. Le document numérique devient composite.
 
la dimension multi-éditoriale

Si la problématique du cahier des charges est de construire à la volée LE document sur LE support, de gérer dynamiquement des documents "en devenir" (à jour en permanence) à partir d'unités d'information définies dans une structure, avec une diffusion la plus automatique possible sur les supports d'aujourd'hui et de demain, alors la Ged ne suffit plus, car elle ne sait traiter que la description du document, pas sa création. Le rapprochement du monde de la documentation et celui de l'édition doit pouvoir se faire sur cette nouvelle génération de système de traitement de l'information qu'est la gestion de contenui. Aux dimensions documentaires et organisationnelles traitées par la Ged, se rajoute la dimension éditoriale et le multicanale. Pour traiter la dimension éditoriale multicanale, c'est-à-dire adapter des contenus à plusieurs supports, il faut pouvoir travailler séparément sur les éléments d'information qui les composent et sur leur expression visuelle adaptée à chaque support de diffusion : c'est la séparation du fond et de la forme, ou plus exactement des formes. Prenons l'exemple du rapport d'activité, intéressant car il rassemble des données issues de plusieurs sources d'information de l'entreprise : données marketing, commerciales, financières, ressources humaines, adresses, références sous la forme de texte, photos, graphiques, tableaux, etc. Traditionnellement, le service de communication en charge de sa réalisation compile chaque année dans un document toutes ces données. Chacune des données peut être caractérisée précisément en définissant sa source (quelle base de données), sa fréquence de mise à jour, son traitement (tableaux, graphiques), son habillage et sa place dans la structure du document, etc. Finalement le "document" rapport d'activité, indépendamment de son aspect visuel, est composé d'un ensemble brut d'unités d'information hétérogènes agencé suivant une structure qui se déclinera en maquettes différentes selon le support de diffusion. La granularité, la finesse de l'information, sera définie en fonction du support le plus contraignant. Chaque support de diffusion demandera sa modélisation particulière avec des règles de construction permettant la génération automatique du rapport complet sur le web ou la diffusion de chiffres clés sur SMS, à partir du système de gestion de contenu.
 

Génération à la volée des différentes unités d’information qui composent une fiche, y compris sa place dans l’arborescencei générale du guide Vos Droits et démarches.
 
  
séparation du fond et des formes

La notion de structuration des données n'est pas une notion récente sur le plan conceptuel et elle est bien connue des documentalistes. Elle est mise en œuvre dans la conception de bases de données bibliographiques, de fiches techniques, de carnets d'adresses, etc.
L'apport du métalangage XMLeXtended markup language. Métalangage extensible dérivé de SGML permettant de structurer des données. Le XML (Extensible Markup Language ou langage de balisage extensible) est un standard du World Wide Web Consortium qui sert de base pour créer des langages balisés spécialisés. Il est suffisamment général pour que les langages basés sur XML puissent être utilisés pour décrire toutes sortes de données et de textes.">i (eXtensible markup language) dans la représentation des contenus permet de marquer, de baliser les unités d'information selon leur fonction (titre, chapitre, sous chapitre, paragraphe, date, etc.) ou selon leur signification dans un corpus donné (formateur, organisme de formation, spécialisation, etc.). Un "document" devient un réservoir d'informations structurées, composé de deux types de données : le texte et les informations de structure. Les données transportent leur modèle de données qui permettra leur réexploitation future dans de nouveaux documents. Réexploitation, rediffusion, recomposition sont désormais possibles, à partir de modèles de données que l'on peut créer à chaque fois que l'on en a besoin pour un nouvel usage : si une entreprise connaît aujourd'hui ses objectifs de publication, elle ignore ce dont elle aura besoin demain.
XML a l'âge de raison maintenant et, bien que ce ne soit pas une normei, il s'est imposé comme standard de structuration tant dans le monde de l'édition que dans celui du documentaire. Comme on l'a déjà vu, ces deux mondes se rapprochent dans la gestion de contenu, dès lors que la problématique de ré-utilisation des données se pose : les données deviennent des ressources à valoriser de multiples façons.
Regardons à l'aide des écrans 1 et 2, deux exemples de diffusion (1) :
La gestion de contenu, c'est d'abord de la gestion de projet avec une forte composante documentaire, mais on ne peut pas faire sans outil ! La gamme d'outils de gestion de contenu est large maintenant, tant dans le monde du logiciel librei que chez les éditeurs, voire les intégrateurs. C'est l'analyse préalable du projet - et les considérations budgétaires - qui mettront le curseur sur l'outil adapté.
La pièce maîtresse de la gestion contenu, c'est le référentiel d'actifs ("Actifs" est la traduction de "asset" ; la terminologie n'est pas stable : on parle aussi de référentiels d'informations, référentiel des contenus.), garant de l'unicité, donc de la cohérence et de la permanence de la validité d'une information. Parmi les différents éléments constituant le référentiel d'actifs :
des documents statiques (bureautiques, graphiques, multimédia) ;
des documents dynamiques : agencement d'éléments (texte, graphiques) issus de bases de données ;
des applications permettant de gérer ces éléments ;
des base de données intégrées ;
des bases de données externes liées via des connecteurs.

les deux mondes de la gestion de contenu

A la lecture de cette liste, on voit que la gestion de contenu est à géométrie variable. On peut scinder l'offre existante (Content management system) en deux grandes familles :
le CMS orientée web (Web content management) où la production de sites web sera privilégiée, mais avec des limites certaines le jour où il faudra produire sur d'autres canaux ;
le CMS orienté entreprise (Entreprise content management) qui permet la production multicanale.
La gestion de contenu a de l'avenir. Si on veut que les professionnels de l'information que sont les documentalistes soient les acteurs majeurs de ce nouvel univers, il faut vite se familiariser avec le "document". LE document sur LE support, c'est un travail en réseau avec plusieurs métiers dans l'entreprise, mais c'est aussi et surtout, en back-office, une véritable ingénierie documentaire dont la profession devrait s'emparer !

(1) Exemples tirés de l'application de gestion de contenu Coperia (Coproduction en réseau de l'information administrative) qui gère le guide Vos droits et démarches sur Service-public.fr, édité par la Documentation Française, mais aussi toutes les reprises de ce guide sur les sites des municipalités et préfectures dans le cadre du comarquage avec la Caisse des dépôts et consignations (cf Archimag n° 170 de décembre-janvier 2004, articlei d'Olivier Roumieux) ; depuis plus d'un an le même flux de données alimente la base de connaissancesi pour le renseignement administratif (le 39-39).
 
* Responsable du département de l'information publique
La Documentation Française
 
quelques définitions du "document"

 
Le document comme forme, signe, médium (1) :

forme : le document est analysé comme objet, matériel ou immatériel et l'étude de la structure permet de mieux l'analyser, l'utiliser ou le manipuler ;
signe : le document est porteur de sens et doté d'une intentionnalité. Il est indissociable du sujet en contexte qui le construit ou le reconstruit et lui donne sens ;
médium : statut du document dans les relations sociales.
Document vs contenu métier (2) :

document : objet autonome permettant de diffuser des informations dans le cadre d'un processus identifié sur un support donné. Il doit répondre à un besoin métier ;
contenu métier : regroupement d'un ensemble d'informations (re)mobilisable au sein de documents (documents imprimables, sites web, mobile…).
Document numérique (3) : ensemble constitué d'un contenu, d'une structure logique, d'attributs de présentation permettant sa représentation, doté d'une signification intelligible par l'homme ou lisible par une machine.
(1) Réseau thématique pluridisciplinaire du CNRS
(2) Thomas Dechilly : " Diffusion de contenus et documents sur Internet " in Publier sur Internet - ADBS Editions, 2004
(3) Rapport établi par le groupe de travail Adae-Aproged sur " la maîtrise du cycle de vie du document numérique " du 10 mai 2005.
 

 

Le Mag

Tout Archimag, à partir de 9,50 €
tous les mois.

Le chiffre du jour

Le magazine Archimag est présent sur les trois podiums dédiés aux revues professionnelles préférées des bibliothécaires, des archivistes et des documentalistes ! Un grand merci pour votre confiance !

Recevez l'essentiel de l'actu !