Article réservé aux abonnés Archimag.com

Web scraping de base de données en ligne et métamoteurs de recherche : une protection juridique fragile !

  • web-scraping-donnees-metamoteur-recherche.jpg

    web-scraping-donnees-metamoteur-recherche
    « Le tribunal admet que le référencement opéré par Leparking.fr traduit une réutilisation substantielle du contenu de la base de données », estime Antoine Gravereaux, DS Avocats. (Freepik/rawpixel.com)
  • Les métamoteurs de recherche constituent un outil utile pour centraliser en un endroit unique les contenus présents sur diverses bases de données en ligne. Dans certains cas, le référencement de contenus tiers peut cependant constituer une atteinte prohibée, comme le rappelle le tribunal judiciaire de Paris dans un jugement du 8 juillet 2021. DS Avocats décrypte pour vous cette décision sur le web scraping de base de données en ligne et les métamoteurs de recherche.

    mail Découvrez Le Push du Veilleur, la newsletter thématique gratuite d'Archimag dédiée aux professionnels de la veille et de la documentation !

    antoine-gravereaux-ds-avocatsDans cette affaire, les juges considèrent qu’en agrégeant et en diffusant des annonces d’automobiles d’occasion en provenance d’internet, le métamoteur de recherche, Leparking.fr, porte atteinte aux droits de l’éditeur du site, Lacentrale.fr, en sa qualité de producteur de base de données.

    La portée de cette décision doit toutefois être relativisée au regard de la position de la Cour de justice de l’Union européenne sur l’indemnisation des préjudices des producteurs de base de données face aux pratiques des métamoteurs de recherche sur internet.

    Le site Lacentrale.fr, une base de données protégée

    Dans la lignée de l’arrêt rendu par la Cour d’appel de Paris le 2 février 2021 à propos du site Leboncoin.fr, le tribunal confirme que l’exploitant d’un site d’annonces en ligne peut bénéficier de la protection accordée au producteur de base de données. En effet, pour retenir cette qualification, les juges constatent que le site Lacentrale.fr contient des informations regroupées de manière méthodique, organisées et classées d’une part et d’autre part que le site propose un service de consultation des annonces s’appuyant sur des critères de recherches préétablis (prix, kilométrage, marque, etc.).

    > Lire aussi : Les 27 bases de données à connaître absolument quand on est un pro de l'info

    Le référencement des annonces constitue une extraction prohibée

    La société, La Centrale, a pu faire constater que la quasi-totalité des 350 000 annonces présentes sur son site Lacentrale.fr figuraient sur le métamoteur de recherche, Leparking.fr.

    Estimant que ce référencement constituait une atteinte à son droit de producteur de base de données, La Centrale a introduit une action à l’encontre d’ADS4ALL, exploitant du site Leparking.fr. Pour se défendre, cette dernière fait valoir que son activité se limite à celle d’un simple moteur de recherche, dès lors qu’un lien figure sur chaque résultat pour rediriger l’internaute vers le site d’origine de l’annonce référencée.

    S’appuyant sur la jurisprudence de la Cour de justice de l’Union européenne (CJUE, 9 novembre 2004, The British Horseracing Board e.a., C‑203/02, EU:C:2004:695), le tribunal saisi de l’affaire n’est pas de cet avis. Il considère que l’extraction opérée par le site Leparking.fr fonctionne par transfert du contenu de la base de données de La Centrale. Il relève que l’utilisateur du site Leparking.fr peut, une fois sa recherche effectuée, visualiser un ensemble d’informations précises sur le véhicule objet de l’annonce (photo, année, prix, kilométrage, etc.) sans avoir à se rendre sur le site d’origine. La présence d’un lien de renvoi vers le site Lacentrale.fr apparaît dès lors futile, l’utilisateur l’employant dans la pratique, uniquement pour contacter le vendeur.

    Une réappropriation préjudiciable, au regard des investissements réalisés par La Centrale

    En sa qualité de producteur de base de données, La Centrale a pris l’initiative et le risque des investissements pour bâtir sa base de données et offrir aux internautes, le premier site en France de véhicules d’occasion.

    Pour bénéficier de la protection accordée par le droit, le producteur de base de données doit justifier d’investissements spécifiques quant à la constitution de sa base de données.

    Parmi les investissements réalisés, La Centrale justifie de la conclusion de contrats de services informatiques avec des prestataires tiers, du recrutement de personnels dans le développement et l’exploitation de son site internet ou encore de moyens mis en œuvre pour organiser le dépôt, la classification et la recherche des annonces et vérifier l’exactitude des informations contenues dans les annonces.

    > Lire aussi : Base de données Pascal et Francis : 14 millions de notices bibliographiques en libre accès

    En reprenant à son compte les investissements réalisés par La Centrale, sans inciter l’internaute à se rendre sur le site Lacentrale.fr, le tribunal admet que le référencement opéré par Leparking.fr traduit une réutilisation substantielle du contenu de la base de données. Les juges estiment en effet que le métamoteur Leparking.fr détourne le trafic du site Lacentrale.fr, avec à la clé des pertes de revenus publicitaires pour La Centrale.

    Cette approche n’est pas sans rappeler l’affaire Innoweb (CJUE, 19 décembre 2013, Innoweb c/Wegener, n° C-202/12). Dans sa décision, la Cour européenne avait considéré que la mise en place par un métamoteur de recherche d’un dispositif permettant d’explorer les données figurant dans des bases tierces protégées, sans que l’internaute n’ait besoin de se rendre sur la page d’accueil du site en question, était de nature à réduire les recettes du titulaire de la base réutilisée.

    Le risque est donc à géométrie variable pour les exploitants de métamoteurs de recherche, qui doivent veiller à ne pas maintenir les internautes « captifs » sur leurs sites et plateformes. En tout état de cause, la présence d’un lien apparaît insuffisante pour écarter à elle seule tout risque d’atteinte au droit des producteurs de base de données.

    > Lire aussi : Droit à l'oubli et au déréférencement sur internet

    Un préjudice financier incontestable, mais insuffisamment démontré

    Au titre de la réparation de son préjudice, la Centrale réclamait une indemnisation à hauteur des investissements réalisés pour la constitution de sa base de données, ceux-ci s’élevant à plus de 1,8 million d’euros par an.

    Le tribunal constate cependant que la société ne démontre pas avoir subi un tel impact financier à la suite d’une perte de trafic sur le site Lacentrale.fr, et retient la somme bien inférieure de 50 000 euros, sans toutefois justifier les raisons l’ayant poussé à retenir ce montant.

    Les producteurs de base de données seront donc bien avisés de prêter attention à cette question de l’évaluation du préjudice lors de litiges à venir face à des métamoteurs de recherche et ce, d’autant plus au regard de la jurisprudence de la Cour de justice de l’Union européenne qui impose au producteur de la base de données, victime d’une extraction de sa base, de justifier d’un risque concret au regard des investissements qu’il a réalisés.

    > Lire aussi : Le droit des bases de données

    Antoine Gravereaux
    [Avocat Associé en droit de l’IT/Data chez DS Avocats]

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    nouveaux-medias
    Sur le Web, à côté de la presse classique qui s’y est exportée pour parfois s’y réinventer, de nouveaux sites d’information politique et générale ou spécialisée ne cessent de faire leur apparition et tentent de conquérir des lecteurs. Parfois thématiques, pouvant cibler telle ou telle frange de public, ils font souvent la part belle à la vidéo. Un expert analyse ce mouvement et ses tendances. Les agrégateurs de presse s’interrogent sur le traitement à réserver à ces nouveaux supports. Il en va de même dans les bibliothèques ou centres de documentation, soucieux d’apporter l’information souhaitée par leurs utilisateurs. Côté back-office, les médias sur le Web recourent à des algorithmes spécifiques et travaillent à l’optimisation de leur référencement. Pour les professionnels de l’information, l’éducation aux médias et à l’information est on ne peut plus d’actualité.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Le chiffre du jour
    C'est le montant total des pénalités infligées aux entreprises en 2022 - et à l'échelle internationale - pour le non respect du RGPD.

    Serda Formation Veille 2023