Avec les conteneurs de données*, l’interopérabilité n’est plus une chimère

Le 19/10/2017 - Par
Le conteneur introduit la notion d’interopérabilité documentaire et ajoute une dimension « intelligente » à l’interopérabilité, qui reste encore aujourd’hui, trop souvent liée, dans l’inconscient collectif, à de purs défis techniques.

[Avis d'expert] Très employé dans le monde informatique, l’interopérabilité est un concept décrivant la capacité de plusieurs produits ou systèmes à interagir ensemble par des échanges d’informations et de services, et ce malgré leur hétérogénéité structurelle et fonctionnelle. Dans le monde de la gestion des connaissances, cette capacité à faire communiquer des systèmes divers entre eux est capitale.

Plus aucun produit ne peut se vanter de centraliser toute l’information et tous les services nécessaires à ses utilisateurs. Poursuivre un tel objectif serait une aberration. En revanche, concevoir un produit suffisamment ouvert, capable d’interactions multiples avec un nombre grandissant de systèmes tiers, constitue une vraie stratégie. Avec une ambition claire : le service aux utilisateurs.

Une volonté d’ouverture

Par définition, l’interopérabilité est transversale. Elle suppose des passerelles efficaces entre les produits pour faire circuler informations et services. Jusqu’à présent les défis de l’interopérabilité étaient surtout techniques. Il fallait pouvoir faire communiquer des technologies différentes, disponibles en des lieux différents, sur des architectures hétérogènes.

Chez Cadic Services nous avons eu très tôt le souci de rendre nos outils, dès leur conception, le plus ouvert possible, tout en maintenant cohérence et sécurité.

Les fondations historiques de l'interopérabilité

L’interopérabilité a trouvé ses fondements techniques dans l’ensemble des normes et protocoles informatiques de ces 15 dernières années (« RPC » (pour Remote Procedure Call), « SOAP », les « web services », les « API REST »). Dans le même temps, les normes documentaires ont permis d’uniformiser les contenus échangés (OAI, Z3950, Unimarc, etc.). L’interopérabilité a dès lors commencé à devenir une réalité, même si elle restait tournée vers les professionnels, familiarisés avec ces différentes normes.

Ces approches seules sont-elles suffisantes dans le contexte actuel ?

Les utilisateurs sont habitués à consommer l’information en continu et sont familiarisés avec des outils numériques de plus en plus accessibles et nomades. Ils s’attendent donc à trouver le même niveau de service dans leurs ressources documentaires. Parallèlement à cela, les métiers de la production d’information sont, quant à eux, de plus en plus pointus et exigeants. La conséquence  de cette sur-spécialisation de l’information couplée à sa massification va finalement à l’encontre de l’objectif du service à l’utilisateur.

Nous sommes donc en plein paradoxe.

(*) Conteneur de données : un concept novateur

Voilà pourquoi nous avons introduit dans notre univers la notion de « conteneur de données ». Le conteneur est une structure de données se situant à mi-chemin entre la production d’informations et sa mise à disposition. Il se positionne également comme un consommateur des données exogènes. Le conteneur introduit la notion d’interopérabilité documentaire, Il ajoute une dimension « intelligente » à l’interopérabilité, qui reste encore aujourd’hui, trop souvent liée, dans l’inconscient collectif, à de purs défis techniques. Le conteneur trouve son sens dans sa capacité à agréger intelligemment des données hétérogènes. Concrètement, il s’agit d’un entrepôt de données dont la vocation est de préparer ces données pour les rendre plus faciles à consommer pour les utilisateurs finaux.

Le secret du conteneur

Le secret du conteneur réside dans la manière protéiforme de l’alimenter, il va plus loin qu’un simple mapping des données, sans être limité par le modèle de données. Il permet la convergence de données issues de fonds et donc de métiers différents en re-créant une cohérence d’ensemble. Pour chaque métier ou chaque nature de donnée, des règles précises de convergence sont définies dans un ETL* propriétaire. Ainsi, on déporte au niveau de l’alimentation du conteneur toute l’intelligence métier et on soulage l’utilisateur final de toute nécessité de compétences spécifiques.

L’atout du conteneur est de redonner aux professionnels la maîtrise de cette convergence dans la définition des objets métier.

Le conteneur offre une vision prismatique de l’information - une même information peut y être présente sous différents angles - l’ambition étant toujours d’en faciliter la découverte. Un biochimiste ne cherche pas de la même façon qu’un commercial ou qu’un juriste. “Le conteneur doit permettre à ces 3 acteurs de trouver rapidement le document décrivant l’autorisation de mise sur le marché de ce nouveau médicament”.

De la donnée au conteneur...

Les règles d’alimentation des conteneurs permettent non seulement de re-travailler l’information entrante, mais aussi de gérer le cycle de vie de celle-ci au sein même du conteneur. On peut ainsi définir quel événement dans le système de production déclenche le transfert vers le conteneur ; pendant combien de temps la donnée y reste, et en fonction de quel critère elle le quitte. Á tout moment il est possible, à partir du conteneur, de revenir vers le fonds et le produit d’origine afin de retrouver les données intégrales. De même, la consommation des services à partir du conteneur fait la plupart du temps appel au logiciel métier d’origine.

Enfin, le conteneur est indéfectible. Si un conteneur est altéré ou perdu pour une raison ou pour une autre, il n’y a aucun impact sur la production ni sur les données sensibles, puisqu’il n’en est que le reflet. Á tout moment, il peut être régénéré à partir des règles définies pour son alimentation.

Avec le conteneur, l’interopérabilité accède à un nouveau stade, conforme à ses objectifs premiers de service à l’utilisateur.

En embarquant les conteneurs de données, le produit Cadic Intégrale se positionne comme un “IAE* documentaire” à part entière.

Á retenir

  • Côté producteur professionnel, le conteneur est un vecteur de valorisation de son travail et de son savoir faire.
  • Côté utilisateur, le conteneur est un catalyseur invisible. Il accélère et facilite la découverte d’information ainsi que la consommation des services liés (réservations, commandes, consultation, emprunts etc.).
  • D’un point de vue exploitation le conteneur est un élément sécurisant.

Il permet de répartir la charge entre les producteurs (qui gèrent les objets métier) et les consommateurs (qui mobilisent les conteneurs). Il est localisable sur une zone protégée du réseau (en DMZ), dissociée de la zone de production.

  • ETL: “Extract Tranform Load”. Il s’agit d’outils de transfert d’informations entre plusieurs sources.
  • IAE ou EAI: “Intégration d’applications d’entreprise” : architecture intergicielle permettant à des applications hétérogènes de gérer leurs échanges

 

Sébastien Mannino
Directeur R&D Cadic Services

Détenteur d'un DESS Informatique et d'une maîtrise en neurosciences, Sébastien Mannino ​travaille dans l'informatique documentaire et la gestion de la connaissance depuis 1995. Il est entré chez Cadic en 1997 en tant que développeur et est aujourd'hui à la tête du département R&D.




 

À lire sur Archimag