les outils pour convertir vos données non-structurées en une vraie mine d’or

 

L’abondance d’informations numérisées rend plus que jamais nécessaire le classement, la description et l’analyse de ces contenus disponibles en ligne et hors ligne. Les solutions de text mining répondent à ces enjeux, à condition d’être choisies en fonction des besoins précis de l’entreprise.

Le text miningi désigne l’ensemble des techniques permettant l’extraction et l’analyse d’informations situées dans des données dites non structurées, à savoir des données qui n’ont pas fait l’objet d’un classement i– courriels, articles de presse, forums de discussion, fichiers divers. Ces données s’opposent aux données structurées, regroupant les extraits de bases de données, les annuaires, les feuilles de calcul et les listes d’adresses. Selon les professionnels de l’information documentaire, plus de 80 % des données disponibles dans une entreprise appartiennent à la première catégorie. Comme on l’imagine aisément, ce volume d’information ne constitue pas nécessairement une richesse exploitée, faute de moyens humains et matériels.
 
contre l’inflation de données, analyse sémantique

Cette inflation informationnelle peut être soulagée avec le text mining. Sa valeur ajoutée réside dans les outils d’analyse sémantique : ils déjouent les pièges liés à la polysémie, c’est-à-dire les mots qui présentent plusieurs sens. Ainsi, le terme orange peut renvoyer vers des domaines très différents : une célèbre entreprise, une ville, un fruit, une couleur. L’analyse sémantique permet de lever ces ambiguïtés en sélectionnant uniquement le thème qui aura fait l’objet d’un paramétrage préalable. Elle distingue le signal – information recherchée – du bruit i– information parasite. Ainsi, l’analyste chargé d’élaborer une revue de presse pour le compte du fameux opérateur télécom n’aura pas à déblayer les scoops relatifs à la charmante bourgade du Vaucluse ni à la variation des cours des agrumes.
 
à ne pas confondre avec la Gedi ou la veille Intelligence économique.  ">i

Pierre Molette, directeur associé de l’éditeur Acetic et responsable de la solution Tropes, observe « qu’un outil de text mining ne doit pas être confondu avec un outil de veille, ni un produit de Ged. Le text mining correspond à la phase 2 (analyse) du processus de veille, mais pas aux étapes amont (collecte et sélection des sources) et aval (restitutioni des résultats). Les solutions de fouille de texte peuvent aussi servir dans des projets de knowledge managementEnsemble de pratiques et d’outils visant à valoriser le patrimoine immatériel, et en particulier les connaissances d’une entreprise (documentation, gestion des compétences, etc.) Environnement qui encourage la création, le partage, l'enrichissement, la transmisson, la capitalisation et l'utilisation des connaissance pour le bénéfice des clients de l'entreprise et de ses collaborateurs.  ">i, pour les analyses marketing, le profilage dans une activité de gestion de la relation client, les classifications des bases documentaires ou les études scientifiques. La formulation des critères et le prix des solutions ne sont pas les mêmes suivant les cas ».
 
nulle solution valable sans coller à la peau de ses besoins

Le choix d’une solution se fera donc en fonction des besoins de l’organisation. Il convient de les définir précisément. Il faut ensuite choisir et retenir les fonctionnalités qui seront nécessaires à l’activité de l’entreprise en gardant à l’esprit le retour sur investissement. Rien ne sert, en effet, d’acquérir tous les modules de langues proposées par les éditeurs de solutions si elles ne sont d’aucune utilité pour l’entreprise. D’autant que le paramétrage de ces solutions n’est pas toujours accessible aux béotiens.
 
8 éditeurs vous proposent des outils pour convertir vos données non-structurées en une vraie mine d’or
 
   198_50_quehoistextmining.pdfi
  
   52 K
   19-03-09
 
 
 
 

Les podcasts d'Archimag
Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.