Découvrez Le Push du Veilleur, la newsletter thématique gratuite d'Archimag pour les professionnels de la veille et de la documentation !
Définition
Le graphe de connaissance est formé de nœuds qui représentent un sujet sur lesquels on a quelque chose à dire (personnes, documents, cellules, étoiles, organisations, concepts d’un thésaurus…) et de relations entre ces noeuds (appartient à, connaît, emploie, et le successeur de…). Chaque nœud peut avoir des informations descriptives, telles qu’un nom, une date de création, un Siret pour une entreprise.
On peut naviguer dans le graphe en suivant des types de relations, par exemple les relations d’actionnariat pour calculer les relations de contrôle entre entreprises.
Des bases de données spécifiques, les triple stores, sont utilisées pour stocker et interroger le graphe de connaissance.
> Lire aussi : Knowledge management : comment choisir son cabinet de conseil + tableau comparatif
Des sources multiples pour les graphes de connaissance
Les graphes de connaissance peuvent être alimentés par des sources multiples ; saisies manuelles, imports de données d’applications de gestion, extractions automatisées depuis des textes non structurés, analyses d’images, intégrations de données d’autres graphes de connaissance.
> Lire aussi : Gestion des connaissances : la révolution de l’intelligence artificielle
Outil d’intégration de données hétérogènes
Le graphe de connaissance est un outil idéal pour l’intégration et l’exploitation de données hétérogènes, c’est cette caractéristique qui fait son succès. Il y a plusieurs raisons à cela :
- L’utilisation d’un schéma d’organisation générique basé sur des triplets réduit le coût du projet d’intégration de données ;
- La modification et l’enrichissement du schéma d’organisation du graphe de connaissance est beaucoup plus simple que l’évolution d’une base de données relationnelle ;
- Les bases de données graphe sont optimisées pour exécuter des requêtes qui traversent le graphe sans a priori sur la manière dont le graphe sera interrogé. Par exemple, une requête trouvera les principaux fournisseurs d’un groupe industriel, les regroupera en fonction de leur contrôle financier, et calculera le volume de commandes consolidé afin de disposer d’une puissance de négociation au niveau des maisons mères des fournisseurs. Les bases de données graphe disposent également d’outils de visualisation et de navigation graphique qui facilitent l’analyse de l’information.
> Lire aussi : Comment la modélisation FRBR peut donner du sens à votre fonds ?
Projets basés sur des graphes de connaissance
Les utilisations des graphes de connaissance sont très variées que ce soit pour des applications ouvertes sur le web que pour des applications fermées au sein de l’entreprise.
Quelques exemples de graphes de connaissance accessibles dans le web, donnant accès à des données réutilisables :
- Graphe de connaissance de Wikidata qui agrège une centaine de millions de sujets et environ un milliard de relations ;
- Data.bnf.fr qui décrit le fonds de la BnF avec des relations riches entre les auteurs, créateurs, ouvrages, éditions, lieux, dates, ouvrages numérisés ;
- Le Cellar qui décrit l’ensemble de la législation européenne, les processus de création des textes, les décisions de la Cour de justice… et sur lequel s’appuie le site EurLEX ;
- Les terminologies de santé mises à disposition par l’Agence du numérique en santé.
> Lire aussi : La datavisualisation, un outil en plein essor
Exemples de graphes de connaissance internes à des entreprises :
- Vue 360° sur les clients dans un établissement financier ;
- Gestion des données de santé pour calculer des parcours de soins préventifs (Voir les applications réalisées par la société H4P) ;
- Description des relations entre les produits d’un catalogue pour faire de la recommandation automatisée. Ce type de graphe est développé par la plupart des grands acteurs du e-commerce.
> Lire aussi : Comment éviter la perte d'informations, d'expérience et de connaissances
Interopérabilité des graphes
L’interopérabilité des graphes est une caractéristique qui les différencie fortement des bases de données relationnelles. On peut par une même requête interroger plusieurs graphes qu’ils soient internes ou externes.
Si les graphes utilisent un modèle de données proche et des référentiels partagés, l’interopérabilité est maximale, mais dans tous les cas il est possible de les faire interopérer.
À titre d'exemple, le graphe de la législation luxembourgeoise intègre automatiquement la description des nouvelles directives européenne à transposer depuis le graphe de la législation européenne. Le projet « graphe culture » du ministère de la Culture qui encourage la mise à disposition des données des institutions culturelles sous forme de graphes de connaissance s’appuie sur cette interopérabilité pour que se construise progressivement une vaste connaissance sur le patrimoine culturel, basée sur l’interconnexion des graphes des différentes institutions.
Les graphes de connaissances sont également un outil puissant pour la distribution de données réutilisables dans l’open data en raison de leur interopérabilité et sa facilité d’intégration.
> Lire aussi : Knowledge management : tendances et innovations des applications
Graphes de connaissance et intelligence artificielle
Les algorithmes d’intelligence artificielle ont besoin d’une représentation du monde pour raisonner. L’organisation de l’information sous forme de graphes ou réseaux sémantiques existe depuis le début de l’IA.
Le graphe de connaissance est utilisé comme base de référence pour les traitements d’extraction d’information : les informations du graphe sur l’ensemble du Championnat de football permettront lors de l’extraction d’une image, de numéro de maillot dans une vidéo, de savoir de quel joueur il s’agit, à quelle équipe il appartient, et de quel match il s’agit (méthode utilisée entre autre par YouTube pour l’annotation des vidéos).
Le graphe de connaissance est utilisé comme base de référence dont pourront être extraites des données pour les traitements dans des outils d’analyse statistique, les résultats des traitements viendront enrichir le graphe.
En se basant sur l’ontologie qui modélise le graphe et sur les données, des traitements d’inférence pourront être réalisés pour générer des informations complémentaires, par exemple, dans un graphe e-commerce, pour inférer que les produits hydrofuges peuvent être proposés pour l’aménagement d’une salle de bain.
> Lire aussi : Initiales K.M : Katia Murawsky, knowledge manager à la MGEN
Outils de graphe de connaissance et sociétés spécialisées
Des outils et sociétés pour la mise en place de graphes de connaissance :
- Bases de données populaires pour la gestion des graphes : GraphDB d’Ontotext, Virtuoso d’OpenLink Software, Amazon Neptune, AllegroGraph de Franz ;
- Outils d’édition d’ontologies (modèle de données) : Protégé et webProtégé de l’université de Stanford, TopBraid de TopQuadrant ;
- Outils d’édition de vocabulaires contrôlés qui peuvent être paramétrés pour éditer des graphes de connaissance : ITM de Mondeca, PoolParty ;
- Une série d’outils en ligne, gratuits et très utiles développés par Sparna : Skos-play.sparna.fr et Shacl-play.sparna.fr ;
- Des sociétés de service spécialisées dans les technologies des graphes de connaissance actives en France : CogniZone, Logilab, Mnemotix
- Consultants spécialisés : Thomas Francart de Sparna, Jean Delahousse…
Jean Delahousse
Expert graphe de connaissance, ontologie, open data
→ jean-delahousse.net