Article réservé aux abonnés Archimag.com

Moteurs de recherche : quand l’intelligence artificielle change les règles

  • nouveaux-moteurs-recherche-intelligence-artificielle-ia-generative.jpg

    intelligence-artificielle-moteurs-recherche-ia-generative
    Image générée avec Dall-E, l’IA générative d’OpenAI. (DR)
  • Intelligence artificielle (IA), traitement des données, pertinence de l’information, expérience utilisateur… Les moteurs de recherche ont évolué tandis que de nouveaux acteurs s’invitent sur la toile et bousculent les pratiques.

    mail Découvrez Le Push du Veilleur, la newsletter thématique gratuite d'Archimag dédiée aux professionnels de la veille et de la documentation !

    Dans le monde des moteurs de recherche, impossible de ne pas évoquer Google qui règne toujours en maître. Selon les derniers chiffres de Statcounter d’avril 2023, Google Search capte 91,4 % de parts de marché françaises, contre 4 % pour Bing, 1,9 % pour Yahoo!, 0,7 % pour Ecosia et 0,6 % pour Qwant. Néanmoins, si le mastodonte californien domine le marché, il ne peut s’arroger le monopole de l’innovation.

    Depuis quelques mois, les IA génératives se sont installées dans le paysage de manière fulgurante, obligeant les retardataires à se mettre à jour. Lorsqu’OpenAI a dévoilé son ChatGTP-3 en novembre 2022, la main du géant Google (mais pas que) a tremblé.

    Pourtant, il existe des différences significatives entre leurs deux approches : si Google est bien un moteur de recherche qui indexe le web pour fournir des résultats, ChatGPT est un modèle de langage (LLMs - Large Language Models) qui génère des réponses en fonction de son entraînement sur un corpus d’apprentissage.

    Lire aussi : ChatGPT, IA génératives... Enquête sur les craintes et espoirs des professionnels de l'information

    Malgré ces disparités, les agents conversationnels impactent déjà la recherche d’informations : l’étude « Les Français et les IA génératives », menée par Talan et l’Ifop, révélait en mai dernier que 31 % des utilisateurs d’IA génératives y effectuent des recherches comme dans un moteur de recherche.

    Si vous interrogez ChatGPT sur le sujet, celui-ci vous répondra pourtant : « bien que je puisse fournir des informations et des réponses à de nombreuses questions, je ne suis pas un moteur de recherche complet comme Google. Si vous avez besoin d’une recherche approfondie sur un sujet spécifique, il serait préférable d’utiliser un moteur de recherche traditionnel. »

    Et c’est justement pour aller au-delà de cette « tradition » que les acteurs du domaine s’orientent de plus en plus vers des mariages entre IA générative et moteur de recherche.

    IA générative et moteur de recherche : un mariage heureux ?

    De son côté, Microsoft a fait grand bruit lors du déploiement de ChatGPT-4 pour augmenter son outil Bing. En dehors de l’expérience utilisateur, la grande différence avec ChatGPT réside dans la mise en avant des sources.

    C’est vers un type de développement comparable que les moteurs de recherche Perplexity.AI et You.com se sont dirigés en intégrant un chatbot AI. Pour ces deux outils, les textes générés par l’IA disposent de puces cliquables vers les différents sites sources ; un détail important pour la vérifiabilité des informations : l’éditeur, la pertinence, ou encore la date de publication y sont indiqués… des éléments que ChatGPT, seul, n’est pas capable de restituer.

    You.com propose aussi de basculer les interactions avec son chatbot en page de recherche « classique » avec des filtres vidéos, images, actualités ou encore « social » pour accéder aux contenus se trouvant sur les réseaux sociaux. Et le volet « IA générative » de You.com va bien au-delà du moteur de recherche : l’outil permet de concevoir du code et des images sur une même plateforme.

    Le service de génération de texte offre la possibilité de préciser à qui le message s’adresse, de choisir la typologie du rendu final (essai, mail, post, paragraphe…) et le ton (spirituel, professionnel, familier, neutre…).

    Lire aussi : Jérôme Ribeiro : "Mettre l’intelligence artificielle au service de l’humanité"

    Si You.com peut s’utiliser en français, il ne rend pas tout à fait hommage à la richesse de la langue de Molière. « En tant que petite entreprise, nous ne pouvons actuellement prendre en charge que les applications anglaises et américaines », explique You.com.

    Face à cette nouvelle concurrence, Google ne reste pas les bras croisés. Si la présentation de son chatbot Bard a plutôt fait un flop, l’entreprise a dévoilé en mai 2023 son nouveau Google Search (bêta-testé uniquement aux États-Unis) doté d’une IA générative dont les réponses apparaissent au-dessus des résultats de recherche.

    Cette évolution bouscule le modèle économique du moteur de recherche californien (dont près de 80 % des revenus proviennent de sa régie publicitaire) et durcit encore plus la guerre du positionnement dans les pages de résultats.

    La quête du meilleur prompt

    « Nous nous engageons à continuer d’envoyer un trafic précieux vers des sites web », rassurait tout de même Sundar Pichai, le directeur général de Google, lors de la présentation du nouveau Google Search.

    Ces modèles hybrides soulèvent aussi la question de la formulation des requêtes. Comment être sûr d’obtenir une information qualitative et pertinente ? Avec l’apparition des IA génératives, plusieurs sites et outils de création de prompt (consigne envoyée à un modèle de langage) ont vu le jour, à l’image de Learn Prompting qui propose des cours en open source sur le prompt engineering.

    Les différents modules sont régulièrement mis à jour et traduits en français. Cependant, qu’ils soient combinés ou non avec des moteurs de recherche, ces agents conversationnels fournissent-ils des réponses satisfaisantes ?

    Lire aussi : ChatGPT, Bard... les IA génératives vont-elles bouleverser vos métiers ?

    « Les grands modèles de langage qui génèrent du texte (Galactica, LaMDA, ChatGPT...) ont le potentiel de créer du contenu qui peut sembler plausible, raisonnable et précis, mais qui ne l’est pas. Nous appelons ce type de résultat “absurdité cohérente” », nous expliquait Rowan Curran, analyste chez Forrester dans le n° 361 d’Archimag.

    Un constat confirmé par l’étude « Évaluation de la vérifiabilité dans les moteurs de recherche génératifs », réalisée par le département informatique de l’université de Stanford, qui révèle qu’à peine 51,5 % des réponses proposées par les IA génératives sont entièrement étayées par des citations existantes.

    Face à ces lacunes, les moteurs Kagi Search, Brave Search ou encore Presearch ont pris le parti de limiter l’utilisation de leur chatbot : par exemple, Kagi Search (sur un modèle freemium) propose uniquement des fonctions de synthétisation/résumé autour de résultats de recherche, d’une page spécifique ou encore d’un document PDF.

    Chercher différemment

    Les évolutions de l’intelligence artificielle ne concernent pas uniquement la partie générative. Les technologies permettent désormais de puiser dans une multitude de ressources au-delà de la recherche textuelle et des métadonnées. Le moteur Listen Notes se concentre sur les podcasts, tandis que Twelve Labs s’intéresse à la vidéo.

    « Notre IA extrait de multiples caractéristiques de la vidéo telles que le temps, les objets, le texte, la conversation, les personnes et les actions, afin de synthétiser la grande quantité d’informations sous forme de vecteurs », explique Twelve Labs. « Ces vecteurs permettent une recherche rapide, sémantique et évolutive. »

    TikTok dévoile lui aussi ses cartes. De loin, le réseau social ressemble à une succession sans fin de petites vidéos plus ou moins drôles, de danses et autres contenus. Mais début 2023 et pendant plusieurs semaines, la plateforme a axé ses campagnes de publicité autour de son moteur de recherche avec la promesse « de prendre le contrôle de votre expérience et d’explorer le monde dans ses moindres recoins ».

    Une communication loin d’être anodine, car TikTok est de plus en plus utilisé comme moteur de recherche, notamment par la « génération Z ». Un usage inquiétant, puisqu’une enquête de NewsGuard révèle que parmi 500 résultats générés sur des sujets d’actualité, le réseau social fait remonter 20 % de vidéos contenant de la désinformation…

    Lire aussi : Niiwaa, un outil de veille et d'intelligence économique multilingue

    D’autres acteurs ne souhaitent pas concurrencer les grands moteurs de recherche en place, mais misent plutôt sur la recherche verticale ou encore sur des expériences utilisateur différentes. Récemment, l’organisation à but non lucratif OurResearch a lancé OpenAlex, un moteur « libre et gratuit d’articles scientifiques, de chercheurs, de revues et d’institutions du monde entier. »

    La prise de pouvoir par l’humain fait aussi partie des tendances, avec des projets comme Legend, Startupy ou encore Grasp qui promet : « un moteur de recherche qui vous donne la priorité. Pas de publicité, pas de spam, pas de contenu-IA ».

    Possibilité de suivre des informations sélectionnées par des personnalités, création de son propre corpus d’informations fiables… Pour ces moteurs, l’IA se met au service de l’intelligence humaine. La résistance s’organise…

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    veille financiere-market-intelligence-profils?
    De l’analyste en intelligence économique au veilleur stratégique, en passant par le spécialiste en data mining, le consultant en stratégie digitale ou encore le chargé de veille concurrentielle… Tous possèdent une expertise spécifique pour aider les entreprises à anticiper les tendances du marché et à prendre des décisions éclairées.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    Serda Formation Veille 2023