Article réservé aux abonnés Archimag.com

Comprendre les graphes de connaissance : définition, sources, applications et outils

  • graphe-connaissance-comprendre-application.jpg

    graphe-connaissance-sources-outil
    Les utilisations des graphes de connaissance sont très variées, que ce soit pour des applications ouvertes sur le web que pour des applications fermées au sein d'une entreprise. (Freepik)
  • Les graphes de connaissance sont une nouvelle manière de structurer des connaissances en organisant l’information sous la forme d’un graphe. Découvrez dans cet article ce qu'est un graphe de connaissance, avec quelles données l'alimenter et différents exemples de projets d'applications utilisant des graphes de connaissance. Faites également le point sur l'intéropérabilité des graphes et sur la façon dont ils peuvent servir de base de référence pour les traitements d’extraction d’information pour des outils utilisant l'intelligence artificielle. Enfin, découvrez en fin d'article différents outils et sociétés permettant la mise en place de graphes de connaissance.

    mail Découvrez Le Push du Veilleur, la newsletter thématique gratuite d'Archimag pour les professionnels de la veille et de la documentation !

    Définition

    Le graphe de connaissance est formé de nœuds qui représentent un sujet sur lesquels on a quelque chose à dire (personnes, documents, cellules, étoiles, organisations, concepts d’un thésaurus…) et de relations entre ces noeuds (appartient à, connaît, emploie, et le successeur de…). Chaque nœud peut avoir des informations descriptives, telles qu’un nom, une date de création, un Siret pour une entreprise.

    On peut naviguer dans le graphe en suivant des types de relations, par exemple les relations d’actionnariat pour calculer les relations de contrôle entre entreprises.

    graphe-connaissance-definition

    Des bases de données spécifiques, les triple stores, sont utilisées pour stocker et interroger le graphe de connaissance.

    > Lire aussi : Knowledge management : comment choisir son cabinet de conseil + tableau comparatif

    Des sources multiples pour les graphes de connaissance

    Les graphes de connaissance peuvent être alimentés par des sources multiples ; saisies manuelles, imports de données d’applications de gestion, extractions automatisées depuis des textes non structurés, analyses d’images, intégrations de données d’autres graphes de connaissance. 

    > Lire aussi : Gestion des connaissances : la révolution de l’intelligence artificielle

    Outil d’intégration de données hétérogènes

    Le graphe de connaissance est un outil idéal pour l’intégration et l’exploitation de données hétérogènes, c’est cette caractéristique qui fait son succès. Il y a plusieurs raisons à cela : 

    1. L’utilisation d’un schéma d’organisation générique basé sur des triplets réduit le coût du projet d’intégration de données ; 
       
    2. La modification et l’enrichissement du schéma d’organisation du graphe de connaissance est beaucoup plus simple que l’évolution d’une base de données relationnelle ; 
       
    3. Les bases de données graphe sont optimisées pour exécuter des requêtes qui traversent le graphe sans a priori sur la manière dont le graphe sera interrogé. Par exemple, une requête trouvera les principaux fournisseurs d’un groupe industriel, les regroupera en fonction de leur contrôle financier, et calculera le volume de commandes consolidé afin de disposer d’une puissance de négociation au niveau des maisons mères des fournisseurs. Les bases de données graphe disposent également d’outils de visualisation et de navigation graphique qui facilitent l’analyse de l’information.

    > Lire aussi : Comment la modélisation FRBR peut donner du sens à votre fonds ?

    Projets basés sur des graphes de connaissance

    Les utilisations des graphes de connaissance sont très variées que ce soit pour des applications ouvertes sur le web que pour des applications fermées au sein de l’entreprise.

    Quelques exemples de graphes de connaissance accessibles dans le web, donnant accès à des données réutilisables :

    > Lire aussi : La datavisualisation, un outil en plein essor

    Exemples de graphes de connaissance internes à des entreprises :

    • Vue 360° sur les clients dans un établissement financier ;
    • Gestion des données de santé pour calculer des parcours de soins préventifs (Voir les applications réalisées par la société H4P) ;
    • Description des relations entre les produits d’un catalogue pour faire de la recommandation automatisée. Ce type de graphe est développé par la plupart des grands acteurs du e-commerce.

    > Lire aussi : Comment éviter la perte d'informations, d'expérience et de connaissances

    Interopérabilité des graphes

    L’interopérabilité des graphes est une caractéristique qui les différencie fortement des bases de données relationnelles. On peut par une même requête interroger plusieurs graphes qu’ils soient internes ou externes.

    Si les graphes utilisent un modèle de données proche et des référentiels partagés, l’interopérabilité est maximale, mais dans tous les cas il est possible de les faire interopérer.

    À titre d'exemple, le graphe de la législation luxembourgeoise intègre automatiquement la description des nouvelles directives européenne à transposer depuis le graphe de la législation européenne. Le projet « graphe culture » du ministère de la Culture qui encourage la mise à disposition des données des institutions culturelles sous forme de graphes de connaissance s’appuie sur cette interopérabilité pour que se construise progressivement une vaste connaissance sur le patrimoine culturel, basée sur l’interconnexion des graphes des différentes institutions.

    Les graphes de connaissances sont également un outil puissant pour la distribution de données réutilisables dans l’open data en raison de leur interopérabilité et sa facilité d’intégration. 

    > Lire aussi : Knowledge management : tendances et innovations des applications

    Graphes de connaissance et intelligence artificielle

    Les algorithmes d’intelligence artificielle ont besoin d’une représentation du monde pour raisonner. L’organisation de l’information sous forme de graphes ou réseaux sémantiques existe depuis le début de l’IA.

    Le graphe de connaissance est utilisé comme base de référence pour les traitements d’extraction d’information : les informations du graphe sur l’ensemble du Championnat de football permettront lors de l’extraction d’une image, de numéro de maillot dans une vidéo, de savoir de quel joueur il s’agit, à quelle équipe il appartient, et de quel match il s’agit (méthode utilisée entre autre par YouTube pour l’annotation des vidéos).

    Le graphe de connaissance est utilisé comme base de référence dont pourront être extraites des données pour les traitements dans des outils d’analyse statistique, les résultats des traitements viendront enrichir le graphe.

    En se basant sur l’ontologie qui modélise le graphe et sur les données, des traitements d’inférence pourront être réalisés pour générer des informations complémentaires, par exemple, dans un graphe e-commerce, pour inférer que les produits hydrofuges peuvent être proposés pour l’aménagement d’une salle de bain.

    > Lire aussi : Initiales K.M : Katia Murawsky, knowledge manager à la MGEN

    Outils de graphe de connaissance et sociétés spécialisées

    Des outils et sociétés pour la mise en place de graphes de connaissance :


    Jean Delahousse
    Expert graphe de connaissance, ontologie, open data
    jean-delahousse.net

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    archives-numeriques-bonnes-pratiques
    Disposer d’archives numériques est une opportunité pour valoriser ses fonds. Une démarche qui vaut autant pour les organismes publics que pour ceux du privé. Valorisation en ligne, via les réseaux sociaux, réalisation d’une exposition virtuelle, etc. : cela est une affaire de stratégie, de ciblage et de réflexion sur les usages. Vient alors la mise en oeuvre.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    Serda Formation Veille 2023