Les internautes sont de plus en plus nombreux, le temps qu’ils passent à surfer est croissant, d’autant qu’ils disposent désormais aussi de smartphones pour accéder au web partout et à tout moment. Les statistiques des questions qu’ils posent à Google, le premier des moteurs de recherche, sont accessibles via Google Trends. Cet outil permet d’obtenir, en temps réel, des renseignements sur les tendances, l’opinion, les comportements, les modes de vie et la psychologie des foules d’internautes.
1. fonctionnement
Google Trends donne accès aux statistiques des requêtes effectuées dans le moteur de recherche depuis 2004, sur des périodes paramétrables, en croisant les résultats selon les pays et les régions, mais aussi selon les sources de recherches - Google Actualités, Google Images, Google Shopping - ou encore selon les catégories - actualités, alimentation et boissons, animaux et animaux de compagnie, etc.
L’interface de recherche offre la possibilité de comparer jusqu’à cinq recherches entre elles avec des booléens, le signe « , » signifiant and le signe « + » signifiant or, le signe « - » signifiant not et les guillemets permettant de rechercher des expressions exactes.
Google Trends permet de comparer des statistiques entre des lieux ou des périodes différents, jusqu’à cinq. Il est aussi possible de visualiser les résultats selon les variables espace et temps, avec l’aide de cartes dynamiques évoluant selon le temps à la manière de vidéos.
prolonger les courbes dans le futur
A la présentation des résultats, des articles susceptibles d’expliquer tel ou tel buzz dans le diagramme des statistiques peuvent être affichés. L’interface permet aussi de prolonger les courbes dans le futur sur la base de grandes tendances. Les résultats sont également affichés sur une carte du monde représentant le volume de recherche de tel ou tel pays.
Les recherches similaires et en progression sont proposées afin de permettre à l’usager d’améliorer ses équations de recherche en identifiant éventuellement un terme source de bruit ou, au contraire, un terme souvent recherché par les internautes et qu’il aurait oublié d’utiliser.
A partir de Google Trends, il est possible d’afficher la liste des dsix requêtes les plus fréquentes dans Google et les requêtes ayant la plus forte progression sur une période paramétrable, selon les pays et les régions, mais aussi en fonction des catégories et des sources de recherche.
Les résultats affichés peuvent être exportés au format CSV pour être réutilisés sur tableurs et analysés avec toutes sortes de logiciels. Ils peuvent également être dynamiquement intégrés au sein de blogs ou de sites web. Le site Barometre-politique.net est par exemple constitué ainsi, pour sa majeure partie, de données provenant de Google Trends. Enfin, il existe des API qui permettent aux programmeurs de récupérer en temps réel les données pour les réutiliser.
2. limites
Les limites de Google Trends sont liées au fait que les données qui ne génèrent pas un volume de recherches suffisant ne sont pas accessibles ou pas accessibles à l’échelle régionale ou encore ne génèrent pas de prévisions. Par ailleurs, les données ne correspondent pas à des nombres absolus de requêtes, mais à des valeurs relatives sur une base 100. Le point le plus élevé d’un diagramme est systématiquement 100. Dans ces conditions, la comparaison entre deux diagrammes différents peut être source d’erreurs d’interprétation si on ne tient pas compte du fait que les données sont relatives et non absolues. Si on souhaite comparer des requêtes Google entre elles, il est indispensable de les faire apparaître au sein de la même requête Google Trends. Or, le nombre de comparaisons est limité à cinq et il est impossible de dépasser cette limite en écrivant la requête directement dans l’URL de Google Trends.
guère d’informations sur les internautes
Les données affichées par Google Trends sont issues des statistiques du moteur de recherche le plus utilisé dans le monde. Elles sont donc volumineuses. Par contre, les adresses IP n’offrent guère d’informations sur les internautes, en dehors de leur localisation, malgré l’existence de comptes Google qui permettront peut être un jour d’obtenir davantage de détails sur eux. Pour cela, il existe d’autres outils assez similaires à Google Trends. Fermé depuis le 1er avril dernier, Yahoo Clues était l’un d’eux. Ce service de Yahoo! offrait un niveau de qualification des données bien supérieur (âge, sexe et même parfois niveau de revenus des internautes), malgré un volume de données plus faible que celui de Google. Yahoo Clues se distinguait aussi en affichant les requêtes ayant généralement précédé ou suivi celle dont les statistiques étaient interrogées.
3. applications
Malgré ces limites et les précautions à prendre dans l’analyse des résultats, Google Trends peut intéresser les professionnels des sciences de l’information ou de l’intelligence économique dans les domaines politiques, scientifique, économique, commercial, sociologique, géopolitique…
On pourrait ainsi observer l’impact des personnalités, des courants politiques ou des croyances religieuses sur le web, des buzz scientifico-médiatiques comme l’étude controversée de Gilles-Eric Séralini sur les conséquences de la consommation d’OGM sur la santé des rats, l’apparition de phénomènes saisonniers comme la neige ou les champignons, l’évolution du langage avec l’apparition ou la disparition de buzzwords ou autres expressions à la mode comme « virtuel », « gouvernance », « modèle économique », « synergie », « interactivité », « faisabilité »… Les statistiques web pourraient aussi en dire long sur le comportement des internautes face au suicide ou sur le nombre de recherches en rapport avec la pornographie sur internet selon les pays.
4. illustrations
sciences de l’information
Si on compare les statistiques de recherche, depuis 2004 et par pays, de l’agrégateur de flux RSS Google Reader dans le moteur de recherche Google, on observe que les internautes de Hong Kong sont ceux qui s’y intéressent le plus (100), suivis par les Chinois (98), les Singapouriens (79), les Taïwanais, les Etats-Uniens (65), les Portugais (65), les Iraniens (64)… Loin devant la France (6). On constate aussi que cet intérêt pour l’outil de veille a significativement diminué en 2012 jusqu’au 13 mars 2013, date à laquelle Google a annoncé son abandon sur son blog et provoqué un véritable buzz sur internet.
politique
On s'intéresse au nombre de personnes ayant fait une recherche sur tel ou tel candidat à l’élection présidentielle française entre avril et mai 2012.
Les requêtes suivantes ont été utilisées pour chaque candidat :
- mp + union pour un mouvement populaire + sarkozy + sarkosy + nicolas sarkozy
- ps + parti socialiste + hollande + françois hollande – play station
- modem + mouvement democrate + bayrou + françois bayrou - iphone – android
- fn + front national + le pen + lepen + marine le pen
- jean luc melenchon + melenchon + jean luc melanchon + parti de gauche + front de gauche.
Nous avons parfois ajouté des termes liés à des fautes d’orthographe ou exclu des mots souvent présents dans les requêtes des internautes d’après Google Trends (termes associés). Entre le 1er avril et le 22 avril, date du premier tour, on obtient un indice d’impact web assez proche du résultat électoral des différents candidats :
Les légères différences entre les statistiques obtenues via Google et les votes réels pourraient s’expliquer par les catégories sociologiques des électorats plus ou moins jeunes, plus ou moins aisées et donc plus ou moins connectées sur le web. Concernant Jean-Luc Mélenchon, en particulier, sa surévaluation sur le web est probablement aussi due à la nouveauté de ce candidat sur la scène médiatique et à un ton de campagne assez inhabituel et susceptible de faire du buzz…
Les statistiques de Google Trends peuvent indiquer, en fonction des dates, le nombre d'internautes qui ont fait une recherche sur Google en relation avec un parti ou un candidat en particulier. Elles fournissent ainsi une indication précieuse de l'impact de tel ou tel candidat sur les internautes. Contrairement aux méthodes classiques de sondage, les données peuvent être accessibles en temps réel, elles ne sont pas retardées par les temps de collecte et de dépouillement et ne sont pas biaisées par la difficulté que les sondés peuvent avoir parfois à assumer oralement un vote d’extrême droite ou d’extrême gauche.
Mathieu Andro
INRA, DV IST, F-78026 Versailles, France