Comprendre les graphes de connaissance : définition, sources, applications et outils

Les graphes de connaissance sont une nouvelle manière de structurer des connaissances en organisant l’information sous la forme d’un graphe. Découvrez dans cet article ce qu'est un graphe de connaissance, avec quelles données l'alimenter et différents exemples de projets d'applications utilisant des graphes de connaissance. Faites également le point sur l'intéropérabilité des graphes et sur la façon dont ils peuvent servir de base de référence pour les traitements d’extraction d’information pour des outils utilisant l'intelligence artificielle. Enfin, découvrez en fin d'article différents outils et sociétés permettant la mise en place de graphes de connaissance.

Découvrez Le Push du Veilleur, la newsletter thématique gratuite d'Archimag pour les professionnels de la veille et de la documentation !

Définition

Le graphe de connaissance est formé de nœuds qui représentent un sujet sur lesquels on a quelque chose à dire (personnes, documents, cellules, étoiles, organisations, concepts d’un thésaurus…) et de relations entre ces noeuds (appartient à, connaît, emploie, et le successeur de…). Chaque nœud peut avoir des informations descriptives, telles qu’un nom, une date de création, un Siret pour une entreprise.

On peut naviguer dans le graphe en suivant des types de relations, par exemple les relations d’actionnariat pour calculer les relations de contrôle entre entreprises.

graphe-connaissance-definition

Des bases de données spécifiques, les triple stores, sont utilisées pour stocker et interroger le graphe de connaissance.

Des sources multiples pour les graphes de connaissance

Les graphes de connaissance peuvent être alimentés par des sources multiples ; saisies manuelles, imports de données d’applications de gestion, extractions automatisées depuis des textes non structurés, analyses d’images, intégrations de données d’autres graphes de connaissance.

Outil d’intégration de données hétérogènes

Le graphe de connaissance est un outil idéal pour l’intégration et l’exploitation de données hétérogènes, c’est cette caractéristique qui fait son succès. Il y a plusieurs raisons à cela :

L’utilisation d’un schéma d’organisation générique basé sur des triplets réduit le coût du projet d’intégration de données ;
La modification et l’enrichissement du schéma d’organisation du graphe de connaissance est beaucoup plus simple que l’évolution d’une base de données relationnelle ;
Les bases de données graphe sont optimisées pour exécuter des requêtes qui traversent le graphe sans a priori sur la manière dont le graphe sera interrogé. Par exemple, une requête trouvera les principaux fournisseurs d’un groupe industriel, les regroupera en fonction de leur contrôle financier, et calculera le volume de commandes consolidé afin de disposer d’une puissance de négociation au niveau des maisons mères des fournisseurs. Les bases de données graphe disposent également d’outils de visualisation et de navigation graphique qui facilitent l’analyse de l’information.

Projets basés sur des graphes de connaissance

Les utilisations des graphes de connaissance sont très variées que ce soit pour des applications ouvertes sur le web que pour des applications fermées au sein de l’entreprise.

Quelques exemples de graphes de connaissance accessibles dans le web, donnant accès à des données réutilisables :

Graphe de connaissance de Wikidata qui agrège une centaine de millions de sujets et environ un milliard de relations ;
Data.bnf.fr qui décrit le fonds de la BnF avec des relations riches entre les auteurs, créateurs, ouvrages, éditions, lieux, dates, ouvrages numérisés ;
Le Cellar qui décrit l’ensemble de la législation européenne, les processus de création des textes, les décisions de la Cour de justice… et sur lequel s’appuie le site EurLEX ;
Les terminologies de santé mises à disposition par l’Agence du numérique en santé.

Exemples de graphes de connaissance internes à des entreprises :

Vue 360° sur les clients dans un établissement financier ;
Gestion des données de santé pour calculer des parcours de soins préventifs (Voir les applications réalisées par la société H4P) ;
Description des relations entre les produits d’un catalogue pour faire de la recommandation automatisée. Ce type de graphe est développé par la plupart des grands acteurs du e-commerce.

Interopérabilité des graphes

L’interopérabilité des graphes est une caractéristique qui les différencie fortement des bases de données relationnelles. On peut par une même requête interroger plusieurs graphes qu’ils soient internes ou externes.

Si les graphes utilisent un modèle de données proche et des référentiels partagés, l’interopérabilité est maximale, mais dans tous les cas il est possible de les faire interopérer.

À titre d'exemple, le graphe de la législation luxembourgeoise intègre automatiquement la description des nouvelles directives européenne à transposer depuis le graphe de la législation européenne. Le projet « graphe culture » du ministère de la Culture qui encourage la mise à disposition des données des institutions culturelles sous forme de graphes de connaissance s’appuie sur cette interopérabilité pour que se construise progressivement une vaste connaissance sur le patrimoine culturel, basée sur l’interconnexion des graphes des différentes institutions.

Les graphes de connaissances sont également un outil puissant pour la distribution de données réutilisables dans l’open data en raison de leur interopérabilité et sa facilité d’intégration.

Graphes de connaissance et intelligence artificielle

Les algorithmes d’intelligence artificielle ont besoin d’une représentation du monde pour raisonner. L’organisation de l’information sous forme de graphes ou réseaux sémantiques existe depuis le début de l’IA.

Le graphe de connaissance est utilisé comme base de référence pour les traitements d’extraction d’information : les informations du graphe sur l’ensemble du Championnat de football permettront lors de l’extraction d’une image, de numéro de maillot dans une vidéo, de savoir de quel joueur il s’agit, à quelle équipe il appartient, et de quel match il s’agit (méthode utilisée entre autre par YouTube pour l’annotation des vidéos).

Le graphe de connaissance est utilisé comme base de référence dont pourront être extraites des données pour les traitements dans des outils d’analyse statistique, les résultats des traitements viendront enrichir le graphe.

En se basant sur l’ontologie qui modélise le graphe et sur les données, des traitements d’inférence pourront être réalisés pour générer des informations complémentaires, par exemple, dans un graphe e-commerce, pour inférer que les produits hydrofuges peuvent être proposés pour l’aménagement d’une salle de bain.

Outils de graphe de connaissance et sociétés spécialisées

Des outils et sociétés pour la mise en place de graphes de connaissance :

Bases de données populaires pour la gestion des graphes : GraphDB d’Ontotext, Virtuoso d’OpenLink Software, Amazon Neptune, AllegroGraph de Franz ;
Outils d’édition d’ontologies (modèle de données) : Protégé et webProtégé de l’université de Stanford, TopBraid de TopQuadrant ;
Outils d’édition de vocabulaires contrôlés qui peuvent être paramétrés pour éditer des graphes de connaissance : ITM de Mondeca, PoolParty ;
Une série d’outils en ligne, gratuits et très utiles développés par Sparna : Skos-play.sparna.fr et Shacl-play.sparna.fr ;
Des sociétés de service spécialisées dans les technologies des graphes de connaissance actives en France : CogniZone, Logilab, Mnemotix
Consultants spécialisés : Thomas Francart de Sparna, Jean Delahousse…

Jean Delahousse
Expert graphe de connaissance, ontologie, open data
→ jean-delahousse.net

Comprendre les graphes de connaissance : définition, sources, applications et outils

graphe-connaissance-comprendre-application.jpg

Définition

Des sources multiples pour les graphes de connaissance

Outil d’intégration de données hétérogènes

Projets basés sur des graphes de connaissance

Interopérabilité des graphes

Graphes de connaissance et intelligence artificielle

Outils de graphe de connaissance et sociétés spécialisées

Les derniers mags :

Les derniers guides :

SPS Commerce : Evaluez vos options EDI, Sept éléments constitutifs d’un service complet d’EDI

Oodrive : Guide Juridique de la Signature électronique : De la loi à l’application

Alfeo : Rapport d’enquête : Les organisations françaises face à la gestion des connaissances

Archimag : Facturation électronique : soyez en première ligne !

Partitio : Transport et Logistique : vers une chaîne logistique plus collaborative, digitale et centrée sur le client ? Les cas du Dossier Transit et du Rapprochement des Factures

Coexel : Libérez le potentiel de la Veille avec l’IA Générative