Article réservé aux abonnés Archimag.com

Le big data est-il l'avenir des professionnels de l'information ?

  • big data infodoc.jpg

    "Le traitement de l’information et des connaissances dans un environnement big data entre dans le domaine des professionnels de l'infodoc" (Pixabay/Geralt)
  • Sommaire du dossier :

    - Big data : plongez dans le grand bain
    - Alliance big data : un groupement pour le big data français
    - Le big data est-il l'avenir des professionnels de l'information ?
    - Le big data à l'épreuve de l'air et du feu
    - Big data : les gazouillis de Twitter sur écoute
    - Le big data, un gisement pour grandes écoles

    Interview de Jean Delahousse, expert des architectures de gestion et de diffusion des contenus et des données. Il est également consultant auprès d’entreprises dans les domaines du text mining, des bases de connaissance et des moteurs de recherche. Il s'exprime sue le rôle des professionnels de l'infodoc sur le traitement de l'information et des connaissances dans un environnement big data.

    Quel est l'impact du big data sur les systèmes d'information ?

    En parallèle du système d'information en charge des applications de gestion de l'entreprise, se développera progressivement un système d'information dédié à des applications big data avec des caractéristiques propres comme la capacité d'intégrer des données externes venant du web ou de l'open data. Ce système d'information disposera d’une infrastructure logicielle pour l’indexation, le traitement statistique, le traitement linguistique et la visualisation de ces informations. Les serveurs utilisés seront adaptés à ce type de traitement qui nécessite de grandes ressource mémoire. Il s agit au final d une infrastructure qui doit pouvoir gérer de grands volumes de données pas où peu structurées, très hétérogènes avec des configurations changeantes en fonction de besoins qui peuvent être ponctuels.

    Qu'est-ce que les technologies sémantiques peuvent apporter dans le traitement du big data ?

    Les données collectées vont de données unitaires simples (lieu et heure d'utilisation d’un service) où des technologies statistiques sont directement opérantes, à des données plus complexes (avis d’un consommateur sur un aspect d’un produit dans un contexte d’utilisation), ou encore plus complexes comme les échanges entre consommateurs discutant d un produit dans un forum thématique par exemple une controverse sur l’utilisation d'un médicament.

    Les technologies sémantiques sont utilisées dans une première phase pour extraire l'information des verbatim multilingue, la structurer et l'homogénéiser. Dans une seconde phase elles sont utilisées pour gérer des modélisations de connaissance métiers qui rapprochent et connectent des données de l'entreprise, de l'open data, des réseaux sociaux, de capteurs... Les technologies sémantiques, comme les ontologies, base de données de graphes, les raisonneurs neufs, ont été conçues pour gérer ces données représentants des connaissances exploitables. La détection et le suivi des effets indésirables de médicaments et des interactions médicamenteuses sont un bon exemple d'une représentation d'un savoir qui devient traitable par les ordinateurs dans l'univers big data.

    Quel rôle les professionnels de l'information-documentation peuvent-ils jouer dans le big data ?

    Big data, technologies sémantiques, linguistiques, statistiques, raisonnement, data visualisation : autant de termes qui reflètent les évolutions rapides dans le traitement de l'information. Ces technologies se connectent pour former un environnement complet qui rend accessibles aux ordinateurs de nouveaux champs d'information.

    La mise en oeuvre technique des différents outils technologiques relève des experts des différents domaines, par contre la mise en oeuvre de projets pour des métiers de l'entreprise est bien du ressort des professionnels de l’information-documentation  avec leur capacité de formaliser le besoins, rechercher des sources de données, évaluer leur qualité.

    Ils devront sélectionner les technologies à mettre en oeuvre pour extraire l'information pertinente des données hétérogènes. Ils devront évaluer la qualité d’une source : richesse réelle de l’information, qualité du sourcing, fraîcheur des données, enquêter sur le processus de collecte... Ils devront indiquer aux experts de chaque technologie ce que l'on cherche à extraire ou comprendre

    Les traitements big data et sémantique nécessitent également de sélectionner et maintenir des référentiels métiers, des vocabulaires, des représentations de connaissances (ontologies), ensemble de tâches qui rentre dans le champ des professionnels de l'information documentation.

    Le big data est-il une voie d'avenir professionnel pour les professionnels de l'information?

    Oui, bien évidemment, et nous venons de le montrer, le traitement de l’information et des connaissances dans un environnement big data entre dans le domaine des professionnels de l'information-documentation. Le big data est un des composants que doivent comprendre les professionnels pour piloter des projets dans lesquels l'information et la connaissance sont centrales. Qui mieux qu'eux peuvent proposer et construire de nouveaux services aux métiers ?

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Rien n’oblige à se mettre au big data. Si ce n’est le fait de vouloir créer de la valeur, de l’activité ou se lancer dans des missions innovantes. Mais tout d’abord, c’est au système d’information de s’adapter à ce nouvel environnement de données volumineuses.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Le chiffre du jour
    C'est le nombre de dossiers médicaux partagés ouverts par les assurés.
    Publicité