Sentiment Analysis : des innovations au service de la compréhension des marques

Don't forget to share this post!

blog-post-example-media

Détection du Sentiment Analysis : 30% des humains ne sont pas d'accord entre eux

Tout le monde le sait, analyser le sentiment (ou tonalité) des contenus postés par les internautes sur les réseaux sociaux, les forums, les blogs ou les sites d’avis, est bien plus compliqué qu’il n’y paraît. En effet, un même terme, en fonction de son contexte, pourra avoir deux sens tout à fait différents et une tonalité radicalement opposée. Plus complexe encore que la polysémie pour une machine de Sentiment Analysis, aussi performante soit elle, est la capacité à comprendre l’ironie, l’exagération, le sarcasme, le second degré, ou… l’humour anglais. ?

Ajoutons à cela que toute langue vivante évolue. Ce qui était un terme « tendance » et « moderne » il y a 18 mois peut être devenu désuet aujourd’hui.

Par ailleurs, la pertinence de la classification en positif, négatif ou neutre par la machine, est elle-même établie par un humain pour savoir si l'algorithme a raison ou tort dans l'apprentissage de la machine. Or deux humains ne jugeront de la même façon que dans 70 % des cas ! Un programme qui serait donc capable de classifier convenablement un corpus de mots au regard du jugement humain, à hauteur de 70% atteindrait la « perfection » … Quoiqu’il en soit, il n’existe pas aujourd’hui de critères incontestables pour déterminer cette fameuse tonalité.

Détection du sentiment analysis : 30% des humains ne sont pas d'accord entre eux

Détection du sentiment analysis : 30% des humains ne sont pas d'accord entre eux Barre d'analyse du sentiment (avec possibilité d'exclure la tonalité neutre)

Sentiment Analysis : des progrès récents et majeurs

De grandes innovations technologiques récentes ont permis de passer un cap considérable dans le domaine du NLP (Natural Language Processing) ou TALN (Traitement Automatique du Langage Naturel) soit une des branches très importante du machine learning et de l’intelligence artificielle permettant à un programme de comprendre le langage humain.

Les équipes R&D de Linkfluence se sont inspirées des dernières recherches en NLP de l’ETH de Zurich (21 prix Nobel à son actif), de l’Université de Harvard ou encore de Facebook Research pour optimiser leurs algorithmes de Sentiment Analysis.

Plus précisément, ce sont dans les systèmes NLU (Natural Language Understanding) que les progrès ont été les plus conséquents. La nouvelle version du Sentiment Analysis de Linkfluence est construite sur des algorithmes qui apprennent à décrypter la structure linguistique de la langue et à expliquer le rôle fonctionnel de chaque mot dans une phrase précise. La machine extrait automatiquement de l'information et peut par exemple la classifier selon sa tonalité, positive, négative ou neutre. Elle tague chaque mot en détectant leur fonction syntaxique, et détermine ainsi les relations syntaxiques entre les mots de la phrase. Ces relations syntaxiques sont directement liées au sens de la phrase étudiée, ce qui permet in fine de mieux comprendre son sens et donc sa tonalité.

Sentiment analysis : des progrès récents et majeurs 3 laboratoires prestigieux qui ont inspiré les équipes R&D de Linkfluence pour optimiser l'algorithme d'analyse du sentiment.

Des résultats notables sur la compréhension des contextes et des différentes langues

C’est à nouveau grâce à l’expertise de Linkfluence en deep learning que les progrès ont été faits. Aujourd’hui, la plateforme de Linkfluence est non seulement capable de comprendre le sens des termes employés, mais en plus d’analyser l’environnement immédiat de chaque mot, leur nature, leurs corrélations et de détecter la nature du contexte.

New call-to-action

En plus des prouesses technologiques, c’est l’association du travail homme/machine qui a été un facteur clé de succès. Ainsi Linkfluence a bénéficié du savoir-faire de ses linguistes que ce soit en langues européennes (Russe, Polonais, Anglais, Espagnol, Hollandais…), langues orientales (avec leur écriture et orthographe complexes, le sens parfois inversé de lecture) ou en langues asiatiques. Sur cette zone géographique Linkfluence est la seule solution SaaS au monde à avoir une compréhension fine d’un panel extrêmement large de langue : Chinois simplifié, Chinois traditionnel, Thaï, Coréen, Japonais….

Des résultats notables sur la compréhension des contextes et des différentes langues Post issu de SinaWeibo en chinois simplifié

Big Data et Deep Learning, des facteurs clés de succès du Sentiment Analysis

Pour que le programme utilisant du NLP soit efficace, il doit pouvoir accéder à un très grand set de données, plus celui-ci est large, plus les entraînements sont conséquents, moins il y a de biais et plus l’algorithme est capable de généraliser de façon pertinente. Avec 200 millions de posts et conversations captés et analysés quotidiennement par Linkfluence, le big data est au rendez-vous et les algorithmes ont une base d’entraînement extraordinairement large et conséquente.

Autre point essentiel, les individus adaptent leur style de langage en fonction du support utilisé. Les conversations sur Instagram n’ont pas la même sémantique que sur les blogs. Il est donc capital que les algorithmes puissent également comprendre cette finesse. Une plateforme d’analyse des réseaux sociaux qui serait très Twitter centric ou exclusivement Facebook centric serait peu compétente pour comprendre les autres médias et réseaux sociaux. Les 300 millions de sources de Linkfluence ont été une mine d’or pour les algorithmes et leur capacité à comprendre finement les subtilités de chacun des réseaux sociaux.

Big Data et Deep Learning, des facteurs clés de succès du sentiment analysis

Une finesse du Sentiment Analysis qui va encore plus loin

L’analyse du sentiment ne se limite pas à la compréhension de la tonalité. Ainsi les algorithmes, grâce au machine learning, peuvent extraire pour une marque précise, l’ensemble des mots clés à tonalité positive qui sont couramment employés par les internautes dans ce contexte et savoir dans quel registre et à quelle valeur de marque ces mots clés sont associés. La fonctionnalité « affect cloud » permet de visualiser l’ensemble des termes ayant en général un sentiment positif quand ils sont associés à la marque et ceux ayant en général un sentiment négatif.

Une finesse du sentiment analysis qui va encore plus loin L'algorithme associe une tonalité (vert positif, rouge négatif) selon le contexte sémantique dans lequel le mot se trouve dans un post.

Ces avancées en NLP et NLU, ont permis le lancement d’une nouvelle fonctionnalité très innovante offrant une vue synthétique des sujets et thèmes les plus importants pour une marque et qui les catégorise simultanément au sentiment positif, négatif ou neutre.

Plus précisément encore, la plateforme va définir si pour cet ensemble un mot précis a généralement dans ce contexte, une tonalité plutôt positive ou négative.

 

Don't forget to share this post!