Documation 2021 - L'IA et la sémantique au service des données textuelles

Le 09/09/2021 (Mis à jour le 10/09/2021 ) Bruno Texier

documation-iatal.jpg

L'intelligence artificielle et la sémantique au service des données textuelles (Archimag)

A l'invitation du GFII, l'éditeur Qwam présente sur le Salon Documation sa solution hybride (intelligence artificielle, sémantique, big data) dédiée à la valorisation des données textuelles. Ces dernières sont trop souvent inexploitées par les entreprises.

Fichiers bureautiques, documents produits au sein d'applications métiers, courriel, avis clients, enquêtes de satisfaction... "Les données textuelles sont partout" constate Erwan Robin-Prévallée (Qwam) ; "malheureusement, seulement une faible partie de ces données sont exploitées par manque de temps ou insuffisance de ressources humaines".

Autre raison pour laquelle ces gisement documentaires sont peu ou mal exploités : les lacunes des métadonnés qui empêchent les organisations d'accéder à leur patrimoine documentaire. Qwam commercialise une solution hybride (intelligence artificielle, sémantique, et big data) destinées à valoriser les données textuelles. L'outil génère des métadonnées, procède à l'extraction d'informations, analyse des masses de textes, et propose des résumés automatiques".

Enrichissement de métadonnées métiers

Pour les métiers de la documentation, ces outils hybrides sont porteurs de promesses. Notamment l'automatisation des processus documentaires : les données textuelles localisées dans les applications métiers sont analysées, enrichies de métadonnées métiers (ajout de facettes de navigation, recommandation de contenus), puis présentées sous forme de datavisualisations.

Autre domaine d'application : le RGPD. Le règlement général sur la protection des données impose en effet l'anonymisation de certaines données personnelles. La solution est en mesure de détecter les personnes éligibles à l'anonymisation.

Plusieurs millions de réponses analysées dans un temps record

En 2019, Qwam avait été retenu pour procéder à l'analyse des cahiers de doléances produits dans le cadre du Grand débat à la suite du mouvement des Gilets jaunes. Plusieurs millions de réponses avaient été analysées avant d'être livrées au gouvernement "dans un temps record".

L'éditeur a publié un livre banc "Intelligence artificielle et valorisation des données textuelles".