Article réservé aux abonnés Archimag.com

3 outils dédiés au traitement des données et des métadonnées

  • outils-traitement-donnees-metadonnees.jpg

    outils-traitement-donnees-metadonnees
    Si des données sont disponibles, pour obtenir une bonne réponse, il faut aussi avoir la capacité de fouiller les documents, quels que soient le volume, l’hétérogénéité ou la diversité de langues. (Freepik/Rawpixel.com)
  • Comment les outils traitent-ils la donnée ? Si des solutions se montrent totalement dédiées à la donnée — ou à la métadonnée —, d’autres voient plus largement. Mais il est tout le temps question de satisfaire un métier. Exemples de positionnement avec trois éditeurs : Stibo Systems pour le MDM ou master data management, Zeenea pour le smart data catalog et Sinequa pour sa search bases application. 

    mail Découvrez Le Brief de la Démat, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des data, de la dématérialisation et de la transformation numérique !


    Sommaire du dossier sur la maîtrise des données et les organisations data-driven :


    Stibo Systems : MDM (master data management)

    Frédéric Marie, directeur général de Stibo Systems (Danemark, 24 personnes en France), présente sa société comme leader dans le master data management (MDM) ou gestion des données de référence. On peut tenter de gérer celles-ci avec son tableur préféré — ce que les petites structures font —, mais arrivé à un certain seuil critique, mieux vaut une solution de gouvernance dédiée. Grâce à elle, il s’agit de savoir qui a le droit de modifier quelles données et à quel moment de son cycle de vie.

    Cycle de vie ? Un produit, par exemple, possède des caractéristiques de taille, de forme, de composition… Une description en est apportée à telle date, publiée dans un catalogue, mise en ligne… Un an plus tard, le fournisseur de tel matériau aura changé, tel élément aura été modifié, telle réglementation sera intervenue… Autant d’impacts sur les données à prendre en compte.

    « La donnée est vraiment vivante », souligne Frédéric Marie. Il convient donc non seulement de l’identifier, mais aussi de la lier et la synchroniser. Le MDM se veut la source de référence unique dans l’entreprise.

    > Lire aussi : Master data management : unifiez vos données de référence avec le MDM !

    Règles métier et utilisateur autonome

    Stibo Systems propose Step, une plateforme totalement intégrée et unique, en Saas et on premise. PDX est son outil de syndication qui embarque les données et les exporte. Une correspondance est établie via un apprentissage par machine learning.

    Une « couche » data as a service (Daas) répond au fait qu’un référentiel n’est pas transactionnel. Le Daas se superpose au MDM, hérite des données et de leurs attributs et est interrogé par les applications via des interfaces de programmation (API).

    Step est entièrement paramétrable, l’utilisateur est autonome, il peut ajouter des règles métier sur un champ, etc., sans avoir à entrer une ligne de code. Step s’adresse bien au métier ; s’il n’y a pas de problématique métier posée, le MDM sera mis en échec, assure Frédéric Marie.

    > Lire aussi : 5 étapes pour mener une gestion des données de référence efficace

    Zeenea : smart data catalog

    Pour Stéphane Jotic, COO de Zeenea, une entreprise est data driven dès lors qu’elle cherche à maîtriser sa donnée et à introduire de la valeur. Zeenea propose une offre de data catalog, disponible en Saas. Les data catalogs visent à concentrer toutes les données de l’entreprise et pas seulement les données de référence.

    La clé est le traitement des métadonnées. Celles que Zeenea prise en compte sont de cinq types : techniques (accès à la donnée), sémantique (point de vue fonctionnel), organisationnel (qui est propriétaire de la donnée, contrôle des données), d’usage (faciliter la production de valeur) et de conformité.

    Modélisation des métadonnées

    Le smart data catalog de Zeenea met en œuvre une modélisation des métadonnées, s’appuyant à la fois sur une ontologie et sur une logique de graphe de connaissances (création de liens à la volée). Des connecteurs permettent d’atteindre les données dans un but d’inventaire et de sélection des actifs pertinents. Un moteur de recherche, avec traitement automatique du langage naturel (NLP) et analyse sémantique, attaque la donnée gérée. Les résultats sont affinés à l’aide de filtres, eux-mêmes évolutifs, pour une exploration personnalisée.

    > Lire aussi : Quels sont les points d’attention et les bonnes pratiques pour assurer l’intégrité de vos données ?

    Sinequa : search based application

    Luc Manigot est vice-président « center of excellence » de Sinequa. L’éditeur français est parti d’une technologie de traitement automatique des langues (Tal). Son moteur de recherche d’entreprise s’est peu à peu étoffé pour devenir une application orientée recherche ou search based application (on premise, cloud, Saas).

    Dans quelle mesure Sinequa s’intéresse-t-il à la donnée ? Pour Luc Manigot, la donnée constitue la totalité de l’information nécessaire au fonctionnement de l’entreprise, y compris l’information non structurée. Sinequa parlerait davantage d’organisation « information driven » que d’organisation « data driven ».

    > Lire aussi : Focus de la Rédaction : L’IA sémantique au service de l’automatisation des processus documentaires et de la conformité RGPD

    Indexer la totalité des données

    Luc Manigot souligne : « La partie la plus difficile à traiter n’est pas la donnée, mais le documentaire ». Des données sont disponibles, mais, pour obtenir une bonne réponse, il faut aussi avoir la capacité de fouiller les documents, quels que soient le volume, l’hétérogénéité ou la diversité de langues.

    La plateforme Sinequa, avec ses 200 connecteurs, récupère les données, en tenant compte des droits d’accès, et les indexe afin de les mettre en valeur selon une problématique métier. Les cas d’usage vont de la recherche de données à caractère personnel, dans une démarche liée au RGPD, à la sécurisation des données.

    S’opposant au MDM qui lie mécaniquement les métadonnées d’une source vers l’autre, Luc Manigot lance : « Renoncez à rapprocher vos référentiels, indexez la totalité des données et fournissez à l’utilisateur les bons outils de visualisation ».

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    maitrisez-donnees-organisation
    Difficile aujourd’hui de tirer de la valeur de son capital informationnel par le seul biais du document. La multiplication des flux, les facilités de création et de stockage plongent les  organisations dans l’ère du big data où se mêlent tous types de données, structurées et non structurées, y compris personnelles, accompagnées de leurs métadonnées
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    Serda Formations Data 2023