Article réservé aux abonnés Archimag.com

Big data : les gazouillis de Twitter sur écoute

  • Gazouillis twitter.png

    "L'outil peut gérer des pics de données de plusieurs millions de tweets par seconde, malgré leur variété" (Pixabay/OpenClips)
  • Sommaire du dossier :

    - Big data : plongez dans le grand bain
    - Alliance big data : un groupement pour le big data français
    - Le big data est-il l'avenir des professionnels de l'information ?
    - Le big data à l'épreuve de l'air et du feu
    - Big data : les gazouillis de Twitter sur écoute
    - Le big data, un gisement pour grandes écoles

    140 caractères seulement par message. Pourtant, Twitter est considéré comme le "pouls du web" où s'échangent en temps réel les dernières tendances. Bouygues Telecom y surveille sa réputation à l'aide d'un outil d'écoute de données massives : Visibrain.

    A raison de 500 millions de tweets postés chaque jour dans le monde (plus de 10 millions en France), le réseau social qui gazouille génère à lui seul des données massives et véloces que seules les technologies du big data, du web sémantique et de la data science sont capables de traiter.

    Les professionnels de l'e-réputation ont bien compris l'intérêt de l'écoute de ces données afin de savoir rapidement ce que les clients d'une marque disent d'elle, que ce soit spontanément ou à la suite de campagnes de communication. C'est l'activité de Tanguy Moillard, responsable du web social chez Bouygues Telecom, pour qui le besoin d'un outil mesurant efficacement les remontées de son travail sur le réseau social s'est fait sentir dès 2012. "A force de nous professionnaliser sur le sujet, le besoin de monitoring s'est de plus en plus justifié, explique-t-il ; et ce afin de poursuivre, multiplier mais aussi améliorer au quotidien nos actions de communication". C'est par l'intermédiaire du business angel Bouygues Telecom Initiatives que l'équipe de Tanguy Moillard, alors en recherche d'une plateforme d'écoute et d'analyse, doit sa rencontre avec Visibrain. Fondé en juillet 2011, l'entreprise française venait de mettre au point une technologie permettant de qualifer et de synthétiser en temps réel de très gros volumes de tweets. "Nous avons pu défricher ensemble le terrain et ainsi progresser mutuellement sur cette activité", poursuit Tanguy Moillard.

    Milliers de tweets par seconde

    Le paramétrage d'un outil souple et sur mesure, très facilement déployable en mode Saas, a particulièrement séduit son équipe. "Avec un simple login et un mot de passe, il est possible de travailler immédiatement, précise-t-il ; en paramétrant les hashtags à surveiller et les mots-clés, nous avons recueilli des résultats concrets sur l'instant".

    Stockant plusieurs terraoctets de données en temps réel, Visibrain les filtre et les classe instantanément. Sa technologie « scalable » lui permet 

    de répondre à chaque augmentation de clients, et donc de volume de données à traiter. "L'outil peut gérer des pics de données de plusieurs millions de tweets par seconde, malgré leur variété, explique Jean-Christophe Gatuingt, le directeur produit de Visibrain ; en effet, nous disposons grâce à notre partenariat avec le GNIP, de l'ensemble du flux Twitter depuis 2006, qu'il s'agisse du texte du tweet, mais aussi de la bio des utilisateurs et du contenu du message (photo, lien, article, etc)".

    Malgré la grammaire succincte et parfois approximative des tweets et des profils des utilisateurs, Visibrain est capable d'enrichir et de structurer ces données sur un ensemble de messages. Concrètement, la plateforme permet à Bouygues Telecom d'identifier les personnes parlant du hashtag surveillé, celles qui le relayent, ainsi que les plus influentes d'entres elles. La plateforme détecte également les nuages de tags et d'expressions associés à ces thématiques et suit cette évolution dans la temps, instantanément. "Et non pas quand il est trop tard pour réagir" précise Tanguy Moillard.

    #4GBouygues

    Depuis deux ans, le lancement de la 4G a beaucoup mobilisé l'équipe du web social de Bouygues Telecom. Sans forcément viser des volumes importants au quotidien, celle-ci profite de temps forts pour s'assurer que le hashtag choisi soit bien installé et monitoré dans la durée afin de devenir référent et visible. Visibrain a notamment permis à l'équipe de constater la réussite de sa conférence de presse de lancement d'octobre 2013, à travers les 4 000 tweets générés intégrant la 4G en moins de trois heures. Au final, le sujet a été évoqué plus de 22 000 fois en 2013 et diffusé par plus de 8 000 utilisateurs. "L'an dernier, le hashtag #4GBouygues a été diffusé 25 millions de fois, poursuit Tanguy Moillard ; sans Visibrain, nous n'aurions pu cumuler ces chiffres". De plus, l'outil permet d'établir des listes d'influenceurs, sortes d'ambassadeurs à contacter, ville par ville, au gré des tournées de démonstration de la 4G réalisées en France. Affinant le ciblage de ses opérations, Bouygues Telecom utilise Visibrain comme un outil d'amélioration continu.

    En constante évolution, la plateforme pourrait bientôt intégrer l'analyse automatique du sentiment, permettant d'identifier la tonalité (positive, négative ou neutre) des messages échangés.

    (1) Revendeur de données agréé et recommandé par Twitter.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Rien n’oblige à se mettre au big data. Si ce n’est le fait de vouloir créer de la valeur, de l’activité ou se lancer dans des missions innovantes. Mais tout d’abord, c’est au système d’information de s’adapter à ce nouvel environnement de données volumineuses.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.
    Publicité