Article réservé aux abonnés Archimag.com

Mais où sont passés les moteurs de recherche français ?

  • recherche jumelles.jpg

    Quelle place reste-t-il pour les acteurs historiques hexagonaux ? (The U.S. National Archives via Visual Hunt / No known copyright restrictions)
  • Historiquement très présents sur le marché français, les moteurs de recherche d’entreprises ont vu leur étoile pâlir avec la montée en puissance des offres pros de Google et des solutions open source. La plupart misent aujourd’hui sur de nouvelles solutions métier et des logiciels dédiés à l’analyse des données.

    « Disons que nous avons tous été confrontés à l’arrivée d’un acteur ultra-puissant, Google pour ne pas le nommer, qui a la capacité de tout écraser sur son passage avec des offres gratuites ou presque gratuites ! », lance Arthur Bessaud, responsable communication de la société francilienne Synomia.

    Après s’être longtemps concentrée sur l’édition de moteurs de recherche pour les sites internet, son entreprise s’est réorientée vers le conseil en « data analytics » et elle compte à ce jour une quarantaine de collaborateurs, dont une majorité de consultants en charge de mener des études s’appuyant sur des technologies d’analyse sémantique (pour l’analyse des réclamations de clients ou la détection des facteurs d’irritation, par exemple...).

    « Il est clair qu’il y a une perte de valeur sur la brique de recherche elle-même », renchérit Laurent Baleydier, cofondateur du moteur cartographique Kartoo, qui a baissé le rideau en 2010, faute de rentabilité. « Les solutions open source comme Lucene (pour l’indexation) ou Elasticsearch (pour la recherche dans de très grands volumes de données distribuées) ont aujourd’hui pris de l’importance, même si elles restent toujours essentiellement destinées aux spécialistes », observe cet expert des interfaces, qui officie désormais comme consultant.

    Au-delà de l’émergence d’alternatives libres très crédibles, Alain Beauvieux, fondateur de l’éditeur de logiciels de veille Ami Software (racheté par Bertin Technologies en mai 2015), estime que les moteurs sont désormais parties intégrantes des « logiciels d’infrastructure » sur lesquels les éditeurs viennent greffer des applications métier à plus forte valeur ajoutée.

    Beaucoup ont à ce titre rejoint les plateformes de mastodontes internationaux : durant ces dernières années, le norvégien Fast Search & Transfer est passé sous pavillon Microsoft ; Perceptive Software a rejoint Lexmark, dont il vient de prendre le nom ; Dassault Systèmes a acquis Exalead ; IBM a jeté son dévolu sur Vivisimo et Blekko ; et Oracle s’est offert Endeca Technologies... Oracle est 

    « en train d’implémenter des technologies de “search” au-dessus des bases de données relationnelles », analyse Gilles André, cofondateur de CustomerMatrix (anciennement Polyspot). L’objectif serait bien sûr d’ajouter à la recherche dans les données structurées de ses propres bases de données de nouveaux outils permettant de sonder toutes les autres informations non structurées (une activité qui fut longtemps la chasse gardée des moteurs).

    Spécialisation

    Quelle place reste-t-il pour les acteurs historiques ? Après son rachat par CustomerMatrix, en 2013, l’éditeur français de solutions de moteurs de recherche Polyspot a pris le nom de sa maison mère et s’est recentré sur le secteur de la relation client. Ses solutions sont désormais utilisées pour analyser « toutes sortes d’informations structurées, semi-structurées et non structurées », précise Gilles André. « Le but est d’aller plus loin qu’avec un moteur classique et d’aller puiser dans tous les systèmes – progiciels, bases relationnelles, bases NoSQL, sites internet et réseaux sociaux... - afin d’améliorer la connaissance du client », affirme Gilles André. Un exemple : Schneider Electric, qui utilise le service en ligne de gestion de la relation client Salesforce, a récemment adopté une solution éditée par CustomerMatrix pour sonder et analyser les e-mails, mais aussi les informations stockées dans les progiciels de gestion, les bases de données, les catalogues de fiches produits ou bien encore les portails web et les fichiers logs...

    Chez Antidot, l’un des principaux spécialistes français des solutions de recherche et d’accès à l’information, Pierre Col, directeur marketing et communication, considère de son côté que « deux principaux axes d’évolution se dessinent ». Le premier est « la verticalisation ». Depuis plusieurs années, Antidot cible spécifiquement les sites de e-commerce avec une offre de « searchandizing » en fort développement, baptisée AFS@Store : les fonctionnalités habituelles d’indexation et de recherche plein texte sont ici complétées par des outils de recherche ciblant les données semi-structurées, comme les fiches catalogues, et les données structurées, telles les métadonnées descriptives des documents...

    Depuis peu, l’éditeur cible aussi des industriels – les fabricants d’appareils médicaux... – soucieux de fluidifier l’accès en ligne à une documentation produit particulièrement prolifique et multilingue. Cela passe, notamment, par une solution full web dénommée Fluid Topics, qui a été pensée pour faciliter « la mise en ligne de la documentation produite avec les outils de rédaction structurée ». Exit les longs PDF pour lesquels la fonction de recherche est « difficile à appeler », rassure Pierre Col. « L’information est publiée sur un portail facile d’accès », qui facilite la recherche et la navigation dans la doc, voire la création de sa propre documentation technique...

    Valorisation des données

    Mais la valorisation des données de recherche (structurées ou non) reste un axe de croissance très important pour Antidot, si l’on en croit Pierre Col : « Antidot Information Factory – utilisé par de grands fournisseurs d’information professionnelle, à la tête de larges corpus de documents – facilite la collecte de données hétérogènes et distribuées, la création de liens contextuels entre les documents et leur classification, et la transformation de ces données éparses en informations enrichies, exploitables sur le web... » Pour citer un exemple, le CNRS l’utilise pour son portail Isidore dédié aux sciences humaines et sociales. L’enjeu ? Proposer un nouvel accès unifié aux travaux de recherche de tous les laboratoires – qui génèrent un très grand volume de données numériques (archives ouvertes de publications scientifiques, sons, photos ou images 3D...).

    Le credo est assez proche pour Sinequa, autre fleuron hexagonal du secteur, qui déclare s’être renforcé dans l’analyse de données et l’analyse sémantique, notamment pour cibler les besoins des grands groupes du secteur pharmaceutique ou de la défense. Le succès est, semble-t-il, au rendez-vous. Un an après son ouverture, la nouvelle filiale étasunienne de cet éditeur génère à elle seule « 50 % de son chiffre d’affaires mondial », selon Laurent Fanichet, vice-président marketing. Avec près de 150 connecteurs « prêts à l’emploi » pour la plateforme Sinequa ES (recherche et analyse de données non structurées et structurées), l’éditeur est aussi le seul Français à s’être hissé parmi les leaders du fameux quadrant magique du cabinet Gartner (au coude-à-coude avec le Canadien Coveo) et il figure dans le peloton de tête d’un classement analogue réalisé par l’institut Forrester (après IBM, HP, Google et Coveo, cette fois). Le moteur en lui-même est peut être une « commodité », comme le reconnaît Laurent Fanichet. Mais les couches supérieures d’analyse sémantique et de catégorisation des données ont toujours autant la cote.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !

    Au sommaire

    - Mais où sont les moteurs de recherche ?
    - La boîte à outils (gratuite) du veilleur​
    - Le versement d’archives à l’ère numérique​
    - Records management : des solutions sur mesure

    DOSSIER E-santé : thérapie par la démat

    L’e-santé n’a plus rien d’imaginaire et devient une réalité non seulement pour les malades, mais aussi pour les médecins et les établissements. Côté dématérialisation, beaucoup est fait, mais reste aussi à faire tant pour le dossier patient que pour le dossier administratif.

    Et aussi :
    - Maîtrisez enfin votre messagerie​
    - Splendeur et mystère des réseaux sociaux de Gallica
    - L’investigation à l’ère numérique
    - Favoris : retoucher ses photos comme un pro
    - Alexandre Léchenet : de data et d’idées
    - Manuel Diaz : "L’anxiété que l’on met autour du numérique n’est pas justifiée"​​
    - Un fab lab dans la Cité
    + Archimag store et Archi...kitsch

    Acheter ce numéro  ou  Abonnez-vous

    À lire sur Archimag

    Le Mag

    Tout Archimag, à partir de 9,50 €
    tous les mois.

    Le chiffre du jour

    c’est la somme que permettrait d’économiser les chatbots aux entreprises, chaque année, d’ici 2023, contre 6 milliards en 2018.

    Recevez l'essentiel de l'actu !