Article réservé aux abonnés Archimag.com

Les moteurs de recherche dopés par l'intelligence artificielle

  • search_IA.jpg

    moteur-recherche-intelligence-artificielle
    Grâce à cette nouvelle puissance de calcul et à l’apprentissage profond (deep learning), la compréhension et la classification des contenus devraient être fluidifiées de façon décisive. (Conçu par Freepik)
  • L’intelligence artificielle s’engouffre partout y compris dans les moteurs de recherche. Les géants de la recherche (Google, Bing…) en raffolent, mais les acteurs plus discrets comme le français Qwant s’y mettent aussi pour améliorer la pertinence de leurs résultats.

    Est-il possible de parler des moteurs de recherche sans évoquer Google ? C’est difficile, mais tout de même possible. Car les concurrents du géant californien de la recherche ne restent pas les deux pieds dans le même sabot. À commencer par le français Qwant qui mise désormais sur l’intelligence artificielle (IA) afin d’améliorer la pertinence de ses résultats de recherche. Il lui a fallu pour cela se doter en 2017 de nouveaux supercalculateurs DGX-1 fabriqués par la société Nvidia.

    Grâce à cette nouvelle puissance de calcul et à l’apprentissage profond (deep learning), la compréhension et la classification des contenus devraient être fluidifiées de façon décisive. « Les applications du deep learning vont changer mes expériences de recherche et de navigation des utilisateurs en fournissant des informations plus précises et filtrées tout en respectant la vie privée », se réjouit-on chez Qwant.

    Avec une vingtaine de spécialistes de l’IA répartis dans ses bureaux en France et en Allemagne, Qwant a passé le cap du milliard de pages indexées à la fin de l’année 2017. Le recours à l’IA sert bien évidemment à améliorer la qualité des résultats de recherche, mais pas seulement. Les algorithmes vont séparer le bon grain de l’ivraie : « Qwant utilise les algorithmes notamment pour détecter du spam qui pourrait nuire à la qualité de résultats de recherche, ou pour détecter des contenus inappropriés qui ne devraient pas apparaître dans ces résultats lorsque les utilisateurs ont activé la recherche sûre (safe search) », soulignent les équipes de Qwant.

    En faisant le pari de l’intelligence artificielle, le moteur de recherche français fait également une bonne affaire. Car, comme ses concurrents, Qwant se rémunère sur les clics des publicités insérées autour des résultats de recherche. Or, plus ces résultats sont pertinents, plus les probabilités que l’internaute clique sur les publicités sont élevées.

    Bing invente le « moteur de perspective »

    Du côté de Microsoft, on voit les choses en grand. Environ 8 000 personnes travaillent sur des projets liés l’intelligence artificielle. Pour Satya Nadella, directeur général du géant informatique, ces moyens humains doivent servir un objectif : « Démocratiser l’intelligence artificielle pour tout le monde et toutes les organisations ».

    Première application à embarquer de l’IA, le moteur de recherche Bing est progressivement en mesure d’apporter des réponses plus étoffées aux requêtes des internautes. Exemple : combien de calories sont-elles contenues dans une part de pizza ? Réponse classique : 391 calories. Grâce à l’intelligence artificielle, Bing apporte un deuxième niveau de réponse : ces 391 calories représentent l’équivalent de 31 minutes de course à pied.

    Ces niveaux de résultats complémentaires sont rendus possibles par l’apprentissage continu et par le partenariat passé entre Microsoft et le site communautaire de partage de liens Reddit. Ainsi les liens les plus partagés par les redditors (les utilisateurs de Reddit) sont pris en considération par Bing qui les réutilise afin d’offrir une réponse qui va au-delà d’un résultat formel.

    Lors d’une conférence de presse qui s’est tenue au mois de décembre 2017, Microsoft a annoncé le lancement d’un moteur de perspective (perspective engine) capable de contextualiser des données chiffrées. Ainsi la requête « quelle est la superficie de l’Afghanistan » ? La réponse, 652 232 km², est accompagnée de l’élément de comparaison suivant : soit la taille approximative du Texas. Nul doute que la comparaison avec le Texas, parlante pour un citoyen des États-Unis, sera bientôt déclinée avec une valeur européenne pour les internautes européens.

    L’IA a également été convoquée pour lutter contre la désinformation. Bing entend jouer un rôle contre les fake news en proposant plusieurs sources d’information sur une même requête et aider les internautes à comparer les différentes versions d’un même fait.

    RankBrain préfigure la recherche vocale de Google

    Cet article commençait par une interrogation : peut-on parler des moteurs de recherche sans évoquer Google ? La réponse est bien évidemment non. Alors que ses parts de marché oscillent autour de 92 % en France et dans de nombreux autres pays, Google essaie d’imaginer le coup d’après avec le programme RankBrain lancé en 2015 : « RankBrain est un algorithme, basé sur les réseaux de neurones, l’apprentissage automatique et l’intelligence artificielle, utilisés par Google pour mieux comprendre l’intention de recherche de l’internaute qui utilise son moteur », explique le spécialiste des moteurs de recherche Olivier Andrieux.

    Concrètement, une requête adressée à Google avec un groupe de mots inconnus est traitée de telle sorte que RankBrain est en mesure de trouver des mots similaires afin d’apporter la réponse la plus précise possible. Un défi que Google doit affronter quotidiennement puisque 15 % des requêtes qui lui sont envoyées chaque jour ne l’ont jamais été jusque-là.

    Avec RankBrain, Google prépare le très proche avenir avec l’évolution prévisible des modes de recherche, notamment les requêtes vocales adressées via Google Home ou l’assistant personnel intelligent baptisé assistant Google.
     


    + repères

    Flint, le robot IA qui filtre l’information

    « Une newsletter personnalisée, confectionnée avec amour par des intelligences artificielles ». Telle est la promesse de Flint, le robot qui navigue sur le web à la recherche des informations les plus proches des besoins des utilisateurs. Pour utiliser Flint, rien de plus simple. Il suffit de s’inscrire (identifiant et mot de passe) et choisir la fréquence de la newsletter (quotidienne, bihebdomadaire ou hebdomadaire).

    Ensuite, il ne reste plus qu’à s’abonner aux résultats de l’un des quatre robots disponibles. Gordon est plus particulièrement dédié au monde de la finance et de la technologie, Yolo veille sur l’information sur le climat et l’énergie, Jeff s’intéresse à la mutation des médias, tandis que Flint s’adresse ainsi à l’internaute : « Je t’envoie des articles de qualité sélectionnés juste pour toi. Mais mon but est aussi de te sortir de ta bulle en essayant de te surprendre ».

    « c’est parce que je me plante que je pousse... »

    Grâce à son intelligence artificielle embarquée, Flint ajuste constamment les résultats de ses recherches en tenant compte des avis des internautes. Ceux-ci peuvent en effet noter la pertinence des résultats proposés. Mais l’IA n’est pas toute seule. Flint explique : « Mes choix résultent d’un apprentissage auprès de ma coach humaine Anne-Sophie Novel, journaliste spécialisée dans les alternatives environnementales, économiques et sociales. Comme pour tout, c’est parce que je me plante que je pousse ».

    --> flint. media

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Archimag-312
    RPA : voilà un sigle à retenir. La robotic process automation représente un marché promis à une percée spectaculaire. Il y a de l’intelligence artificielle dans cette technologie, certes. Surtout, elle s’applique à des cas d’usage dont on attend d’appréciables retours sur investissement.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Le chiffre du jour
    des bibliothèques proposant des ressources numériques ont constaté depuis le début du confinement une augmentation des usages de leurs ressources en ligne, selon une enquête flash menée par le ministère de la Culture fin mars 2020.
    Publicité

    Veille 2020.PNG