Article réservé aux abonnés Archimag.com

Opinion mining : pourquoi et comment pratiquer l'analyse de sentiments sur internet ?

  • opinion_mining_sentiment_tonalite_internet.jpg

    opinion-mining-sentiment-analysis-tonalite-web
    Les données issues de l'opinion mining permettent de mieux comprendre l'environnement d'une entreprise et d'anticiper les phénomènes qui s’y rattachent. Elles peuvent ainsi optimiser leurs actions marketing et commerciales. (Freepik/Rawpixel.com)
  • Entreprise plongée dans un environnement très concurrentiel, responsables marketing ou de communication lancés dans des campagnes de promotion… Pour le veilleur, l’analyse de sentiments ou des expressions d’opinions sur internet devient un impératif dans son soutien à la stratégie et aux métiers. Voici plusieurs rappels théoriques et méthodologiques sur l'opinion mining ainsi qu'une typologie de l’offre logicielle.

    Temps de lecture : 9 minutes.

    Encore appelée analyse de tonalité, sentiment analysis ou opinion mining, l’analyse de sentiments est un processus qui permet de déterminer la tonalité émotionnelle qui se cache derrière une série de mots. C’est une analyse utilisée afin de mieux comprendre la perception, les opinions et les émotions exprimées dans une mention en ligne.

    Un million d’opinions par jour sur le web et les réseaux sociaux

    Avec internet et l’avènement des réseaux sociaux, les utilisateurs ont pris l’habitude de laisser leurs opinions en ligne, dans les forums, les blogs, sur Facebook ou autres. Par jour, on compte en moyenne plus d’un million d’opinions qui sont laissées par les électeurs, les clients, les concurrents…

    Analyser les expressions d’opinions sur internet est devenu un véritable enjeu et une nécessité pour tous ceux qui désirent survivre sur le marché aujourd’hui. C’est une tâche qui demande beaucoup de rigueur et de méthodologie, mais de nombreux bienfaits en résultent.

    enlightenedLire aussi : Quel outil de veille média choisir pour gérer votre e-réputation (comparatif) ?

    1. Opinion mining : définition et méthode d’analyse

    A quoi sert l'opinion mining ?

    L’analyse des expressions d’opinion sur internet est utilisée dans de nombreux domaines. Dans l’entreprise, elle aide à évaluer les produits et services et analyser l’e-réputation sur la base des avis et commentaires laissés par les clients.

    Elle aide encore au positionnement en permettant d’identifier la clientèle cible ou de déterminer le succès d’une campagne de communication et sert d’appui aux systèmes de recommandation (ne pas proposer des produits qui ont des mauvaises notes par exemple).

    En politique, elle permet d’évaluer une politique et lors d’élections, d’analyser les opinions des citoyens sur les candidats. Dans le domaine cinématographique encore, elle permet l’analyse des critiques des films.

    Susciter des réactions, identifier des leaders ou des spammeur

    L’opinion mining ou l'analyse des sentiments permet de connaître l’opinion des uns et des autres par rapport à des sujets donnés et d’analyser la popularité et les tendances sociétales. Elle permet d’aller encore plus loin et susciter des réactions, identifier des leaders d’opinions et/ou spammeurs d’opinion et détecter des communautés…

    Pour cela, elle a recours aux techniques de la sociologie telles que l’analyse qualitative, l’analyse manuelle, l’analyse sociologique des corpus de taille réduite sélectionnés pour former un panel d’études. Elle fait également appel aux méthodes informatiques de développement et d’analyse automatique des corpus.

    enlightenedLire aussi : Comment bien gérer son e-réputation en 4 étapes faciles

    Comment procéder ?

    Avant de démarrer l’analyse, il faudrait être capable de reconnaître l’opinion dans un corpus ; pour cela, plusieurs concepts clés doivent être maîtrisés :

    Une opinion est définie comme un quintuplet (ei, aij, oijkl, hk, tl), où :

    • « ei » est l’entité ;
    • « aij » est un des aspects de « ei » ;
    • « hk » est le titulaire ;
    • « oijkl » est son orientation ;
    • « tl » est la date où elle a été exprimée (une opinion peut être fluctuante dans le temps).

    Pour identifier un quintuplet dans un corpus, il faut tout d’abord identifier l’entité qui est la cible de l’opinion. Il peut s’agir d’un objet, d’un produit, d’un évènement, d’une personne… Ensuite, l’aspect de l’entité ciblée par l’opinion. Parfois, l’opinion peut porter sur l’entité en général (ex. : « quels beaux verres ! »). Par la suite, déterminer l’orientation de l’opinion, c’est-à-dire sa polarité positive, négative ou neutre. Il est nécessaire au préalable de faire la distinction entre une expression objective (fait) et subjective (opinion). Une opinion peut aussi être régulière (une appréciation) ou comparative (en comparaison avec une autre entité). Enfin, il faut identifier le titulaire de l’opinion, celui qui s’exprime. Il est d’autant plus important à distinguer, car il pourrait s’agir d’un phénomène de masse où le même sentiment est partagé ou rejeté par la majorité.

    enlightenedLire aussi : E-réputation : 35 % de faux avis de consommateurs sur les sites de e-commerce

    Quel est le but visé ?

    Lors de l’analyse, la prise en compte de ces différents éléments dépend surtout du but visé par l’étude.

    Par exemple, on peut omettre le titulaire si l’on souhaite faire des statistiques sur un grand nombre de documents, ou tout simplement ignorer la date si on travaille à fenêtre temporelle fixée. Dans certains cas, on pourrait avoir à tenir compte d’autres paramètres pour approfondir l’analyse, comme le sexe, l’âge… 

    L’analyse des sentiments s’intéresse à l’orientation d’une opinion par rapport à une entité ou à un aspect d’une entité. Il existe deux grandes catégories d’analyse : l’analyse lexicale et l’analyse par apprentissage automatique.

    • Analyse lexicale :

    L’analyse lexicale est une approche qui consiste à déduire l’émotion dégagée par une phrase à travers une analyse sémantique des mots.

    La phrase, objet d’étude, est classifiée via des instances de phrases déjà existantes et pour lesquelles des émotions ont déjà été identifiées. Pour cela, on utilise des dictionnaires qui référencent les mots annotés de la polarité et le contexte pour lequel celle-ci est valable.

    • Analyse par apprentissage automatique :

    Par contre, dans l’analyse par apprentissage automatique, les mots sont classifiés sur la base des algorithmes. Les principales méthodes de classification des mots ont recours à la classification naïve bayésienne, au principe d’entropie maximale ou à la machine à vecteurs de support.

    Aujourd’hui, de nombreux logiciels et outils informatiques ont été développés et édités sur la base de ces deux typologies d’analyse et sont en vente sur le marché afin de rendre l’analyse des sentiments à portée de tous.

    enlightenedLire aussi : L'e-réputation vue par un praticien : découvrez quelques pages du dernier livre de Camille Alloing

    2. Les logiciels d'opinion mining et outils d’analyse

    Quelle offre pour l'analyse du sentiment et l'opinion mining ?

    L’offre est de plus en plus foisonnante sur le marché. Des cabinets et agences de veille, de gestion de la réputation en ligne et de social monitoring ainsi que des éditeurs de logiciels ou des outils en ligne, il y a profusion !

    Ceux-ci offrent des services allant du social media monitoring à l’analyse même de sentiment sur un seul réseau social, en passant par le management de l’e-réputation d’une marque ou d’une personne. Ils proposent ainsi la mesure de la visibilité, le décompte des citations d’un nom de marque sur les blogs, l’analyse des opinions exprimées au sein d’un bouquet de sites sur une thématique donnée, la possibilité de réagir presque de manière instantanée à un commentaire de consommateur…

    Sous l’effet de la concurrence, les offres sont souvent sous forme de pack proposant la création d’un site pour une marque, la campagne de communication, le référencement et l’évaluation de son image.

    enlightenedLire aussi : Les entreprises françaises de plus en plus présentes sur le web

    Services gratuits ou payants

    Sur le marché, on peut retrouver des services gratuits et des services payants.

    Les solutions gratuites permettent de suivre un aspect particulier de la conversation web. On a par exemple Samepoint (pour la gestion de l’e-réputation), SocialMention (pour l’analyse et le suivi en temps réel des médias sociaux), BoardTracker (pour la recherche dans les forums de discussion), Twilert (pour la veille sur Twitter) ou encore Comment (pour le suivi de commentaires)…

    Les solutions payantes proposent quant à elles des offres intégrées et packagées qui ne comprennent pas toujours du sentiment analysis. Elles sont en général proposées par abonnement. Le prix peut varier en fonction du nombre d’utilisateurs futurs de la solution, du nombre de requêtes autorisées, du type de fonctionnalités souscrites… Des mentions sont quelques fois indiquées par les prestataires au niveau des packs pour indiquer à quels types d’utilisateurs s’adresse la solution.

    Les fonctionnalités proposées

    De manière générale, les offres packagées payantes et s’adressant aux marques et grandes entreprises — qu’il s’agisse de logiciels ou de plateformes clé en main — comprennent le sourcing, la collecte (automatisée) des entités mises sous surveillance, l’archivage des données, leur traitement, l’analyse des données et la livraison des résultats sous différents formats.

    • Le sourcing
      Le sourcing est une technique qui consiste, sur la base de mots-clés déterminés au préalable, à mettre en place une méthode de surveillance de ces mots. Ainsi, chaque fois que ceux-ci seront cités dans un passage, l’entité en sera notifiée. Habituellement, ce système est mis en place sur les principaux réseaux sociaux et sites web.
      Une fois le périmètre (les mots-clés) du sourcing défini, tout un travail de qualification (avec parfois attribution d’un indice de fiabilité ou de pertinence des sources), de catégorisation, ou encore de cartographie des sources, est mis en œuvre.
    • La collecte des données
      Après le sourcing vient la collecte des données. Quoique le processus soit informatisé, elle doit néanmoins être bien paramétrée. Cela se fait à travers le choix du ou des bouquets de sources à crawler (le client peut par exemple demander une mise sous surveillance de sites qu’il a l’habitude de consulter) ; le choix du type de sources à crawler (réseaux sociaux, blogs, sites de presse) ; la granularité et la régularité du crawl (qui peut aller jusqu’à une collecte en quasi-temps réel)…
    • Archivage et traitement des données
      Une fois collectées, les données sont archivées et traitées selon le mécanisme mis en place par le prestataire de l’outil. Par la suite, les données peuvent être analysées au choix en fonction du volume, de la fréquence d’apparition ou encore par analyse de tonalité, évolution comparée…
    • Livrables et reporting
      L’analyse étant terminée, les données sont le plus souvent livrées à travers des tableaux de bord téléchargeables, des newsletters ou du reporting…

    enlightenedLire aussi : Soft power et influence française

    3. Les avantages (et les limites) de l'opinion mining

    Les avantages du sentiment analysis 

    L’analyse des expressions d’opinion sur internet constitue un véritable avantage compétitif pour l’entreprise qui la réalise. Grâce à la grande base de données établie et collectée dans le cadre de l’étude, les entreprises peuvent mieux comprendre leur environnement interne et externe et anticiper les phénomènes qui s’y rattachent. Elles peuvent ainsi améliorer et optimiser l’efficacité de leurs actions marketing et commerciales à travers une segmentation stratégique ou en mettant en place une stratégie marketing différenciée par type de clients grâce à l’élaboration d’une segmentation comportementale.

    Le sentiment analysis leur permettra également d’accroître l’efficacité de leur campagne marketing (e-mailing…) grâce au ciblage des clients à fort potentiel. Elles pourront aussi réaliser un investissement commercial adapté et optimisé à travers une prédiction du potentiel de vente par zone géographique ou encore effectuer un diagnostic de la relation client grâce à une analyse par text mining de posts sur les réseaux sociaux.

    Les limites du sentiment analysis

    Malgré ses bienfaits pour l’organisation, le sentiment analysis se heurte à de nombreuses difficultés dues à la complexité du langage humain. En effet, il est difficile, voire impossible de penser qu’une machine peut être formatée à comprendre l’ironie, le sarcasme, les variations grammaticales, l’argot ou les spécificités sociales et culturelles que peut renfermer un commentaire en ligne.

    De plus, les langues évoluent et le vocabulaire change constamment ; autant d’éléments qui doivent être pris en compte lors de l’analyse. Par exemple, dans la phrase « Il y a une grève des chauffeurs de bus aujourd’hui, il va falloir que je prenne un taxi pour aller travailler. Super ! », le mot « super » peut-être traduit comme un sentiment positif par une machine ; ce qui n’est absolument pas le cas.

    enlightenedLire aussi : Attention à l'externalisation de la modération des commentaires !

    Absence de structure prédéfinie pour un commentaire

    Une autre difficulté rencontrée par l’analyse des sentiments est qu’il n’existe pas de structure prédéfinie pour un commentaire. Les commentaires sont libres et regorgent souvent de nombreux détails « superflus » et donc inutiles dans le cadre de l’analyse, qui doivent être identifiés et éliminés.

    De plus, un commentaire peut faire référence à plusieurs aspects d’un même produit ou service et exprimer des sentiments différents pour chacun d’entre eux. Par exemple : « l’hôtel était très beau mais le service laissait à désirer ». Dans ces cas complexes, il est difficile de caractériser le commentaire en n’utilisant qu’une seule valeur. Il faudra par exemple décomposer le commentaire en autant de sous-parties qu’il y a de sujets et analyser ensuite les sentiments correspondant à chaque volet.

    Bénéfice compétitif certain

    Certes les difficultés rencontrées par l’analyse des sentiments sont bien réelles, il n’en demeure pas moins que cela reste une étude qui présente un grand intérêt pour l’entité qui l’effectue. Elle revêt de nombreux avantages et fournit dans tous les cas, un bénéfice compétitif certain. Malgré son coût, c’est le type d’investissement qu’on regrette rarement !

    Ikram Bouzikar
    Gérante fondatrice de OnyxMedia

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    gestion-electronique-courrier
    Dans les organisations privées et publiques, la gestion de courrier est une problématique universelle. Ce sont des flux papier et numériques à capter, traiter et mettre à disposition. On peut s’en charger soi-même ou recourir à l’externalisation, selon les enjeux, la volumétrie, les ressources internes, l’environnement…
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Le chiffre du jour
    dont 290 numéros en accès libre, soit 20 000 pages d'articles... Archimag met à jour sa collection en ligne ! Le magazine de référence des professionnels du management de l'information complète la numérisation de ses anciens numéros jusqu'en décembre 2020 et permet désormais aux internautes de consulter gratuitement ceux couvrant la période de sa création, en juin 1985, jusqu'en décembre 2015.
    Publicité

    Veille 2020.PNG