Publicité

Les 3 étapes centrales de la veille et l’apport concret de l’intelligence artificielle

  • Il est communément admis que la veille comporte 5 à 6 étapes. Parmi elles, la collecte, l’analyse et la diffusion peuvent bénéficier d’un apport concret de l’IA.

    [TRIBUNE] Précisons que le terme IA est aujourd’hui galvaudé, devenu un buzzword que l’on retrouve dans tous articles sur le digital, les publicités pour les téléphones, bref, partout.

    Pour être concrets et pragmatiques, disons que le terme IA regroupe les IA faibles, dénommées algorithmes avancés il y a trois ans, et IA fortes, capables d’apprendre soit par une « éducation » faite par l’humain, soit par la « digestion » d’un volume important de données.

    Prenons les étapes de la veille une par une :

    La collecte

    Elle peut être fortement améliorée grâce à l’intégration d’un moteur sémantique, guidant le crawler (outil de collecte automatisé de données) qui va parcourir le web, souvent à partir d’un point d’entrée indiqué par le veilleur. Ces moteurs sont le plus souvent de l’IA faible. Leurs limites technologiques sont la célérité de l’analyse et la capacité d’affinage (par l’humain ou par une IA forte, abordée dans les parties en infra) des ontologies qui sont derrière cette analyse. La valeur ajoutée qu’apporte un tel outil sémantique est un gain de temps pour le veilleur et la récolte d’une plus grand nombre de données pertinentes.

    L’analyse

    Cette étape offre un large terrain de jeu a l’IA, à la fois pour l’apprentissage par le biais du machine-learning et de l’éducation – ou modestement du paramétrage – par le veilleur analyste. Cet apprentissage fait appel le plus souvent à des méthodes d’IA faibles largement éprouvées. Ceci permet aussi par exemple la détection automatique d’entités nommées qui facilitent la lecture et par la même occasion permet de constituer une base de connaissance. Cette base de connaissance avec cette étincelle d’intelligence humaine aboutit à des synthèses « intelligentes et intelligibles » d’agrégats qui font sens et facilitent la lecture et l’analyse. Cette richesse sémantique peut aussi ruisseler sur la collecte en affinant sa précision.

    La diffusion 

    Elle met le lecteur (parfois à son insu) à contribution pour la bonne cause. En enregistrant la navigation que peut faire un consommateur de la veille qui va naviguer sur la plateforme de restitution de la veille, des profils et des habitudes peuvent être déterminés et exploités par le deep-learning. La notion de sérendipité revient à la mode. C’est par exemple comme cela que des sites en ligne vous proposent des articles en complément de votre panier. Plus intéressant encore pour le veilleur : ce graphe de connexions issu d’un comportement humain peut à son tour être réinjecté au service de la collecte pour compléter une base de connaissances, en développant et reliant entre eux des thésaurus ou ontologies améliorées.

     

    Portrait_BE_new2_0.jpg

    Bruno ETIENNE,
    Président de KB Crawl SAS
    KB Crawl SAS

    Tél.: +33(0)1 41 29 05 05
    @: infos@kbcrawl.com
    www.kbcrawl.com

     

    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.
    Publicité

    Serda Formation Veille 2023