Analyse de données textuelles avec Semdee

Analyse de données textuelles avec la technologie My_Knowledge

plateforme analyse de données textuelles my_knowledge

Dans l'ère numérique actuelle, la quantité de données textuelles générées chaque jour est phénoménale. On estime que 80% des données en entreprise sont des données textuelles. Emails, réseaux sociaux ou encore avis clients, les entreprises et les organisations sont submergées d'informations textuelles.

Cependant, extraire des insights exploitables à partir de cette masse de texte peut être une tâche compliquée. C'est la qu'intervient l'analyse de données textuelles, boostées par les avancées en termes d'intelligence artificielle grâce au deep et au machine learning.

Les bases de l'analyse de données textuelles

D'où proviennent les données textuelles

Omniprésentes au sein de l'entreprise, les données textuelles peuvent avoir de multiples sources. Comme le dit le fameux dicton "les paroles s'envolent mais les écrits restent". Ainsi, on traite de la donnée textuelle à tous les niveaux d'une organisation. Que ce soit pour faire le reporting d'une réunion, communiquer par email, solliciter ses clients pour avoir leur avis, tout ceci se fait par de l'information textuelle. On peut distinguer les sources internes et externes à l'organisation pour considérer notre analyse de données textuelles.

source pour analyse de données textuelles

Le prétraitement des données textuelles

Selon la provenance de la donnée textuelle, plusieurs prétraitements peuvent être nécessaires. Par exemple, les données externes à l'organisation nécessitent d'aller "crawler" le web, afin de récupérer les données souhaitées. En effet, ces données ne sont pas directement présentes au sein de l'organisation. Pour ce qui est de la donnée déjà existante en interne, (formulaire de contact, réclamation, compte rendu...), un "cleaning" des données textuelles peut être également nécessaire. On entend par là la normalisation des phrases, de la ponctuation, la suppression d'éléments vides ou encore l'ajout de données quantitatives. Néanmoins, nous allons voir que cette étape de cleaning n'est pas forcément nécessaire en fonction des méthodes utilisées. Il existe des outils d'analyse de données textuelles (notamment les intelligences artificielles) qui peuvent s'en affranchir.

Outil d'analyse de données textuelles : les différentes générations

Depuis l'émergence de l'informatique, beaucoup de process ont pu être digitalisés. L'analyse de données textuelles n'échappe pas à la règle. On peut distinguer cependant plusieurs générations d'outils :

 

- Les outils keywords : Outils d'analyse par mot clé. Ils représentent les premières générations d'outils d'analyse de données textuelles. Ils ne prennent pas en compte le sens du mot.

 

- Les outils sémantiques : Cette génération d'outils permet d'interpréter le sens du mot. Pour cela, on met en place un dictionnaire indiquant la signification de chaque mot. La juxtaposition des mots permet ainsi d'interpréter le sens de la phrase.

- Les outils d'intelligence artificielle : Grâce aux nouvelles technologies d'intelligence artificielle, ce n'est désormais plus le mot qui compte mais le sens général du contenu dans son contexte. L'intelligence artificielle cognitive My_Knowledge par exemple permet de rapprocher des contenus ayant le même sens avec des mots différents, comme le ferait un être humain.

My_Knowlegde : L'intelligence artificielle pour analyser les données textuelles

Une IA inspirée des mécanismes cognitifs du cerveau

My_Knowledge est une intelligence artificielle inspirée de la cognition humaine. A l'origine, des chercheurs en neuroscience s'intéressent au mécanisme du cerveau humain. Ils s'interrogent sur notre capacité à analyser, indexer et classer l'information pour créer de la connaissance.

Ce mecanisme est modélisé mathématiquement, ces mathématiques retranscrit en code informatique pour créer une intelligence artificielle. Concrètement, l'IA My_Knowledge va d'abord analyser le sens général de tous les contenus pour en comprendre le contexte. Par la suite, elle va analyser les données textuelles pour comprendre le sens de chaque contenu dans ce contexte. Enfin, elle rapproche les contenus ayant des sens proches selon la proximité souhaitée.

La proximité, ce qui fait toute la différence dans une analyse de données textuelles

La proximité est la base même de notre système de classification d'informations. Si on parle de sujet spécifique comme par exemple le text mining, je vais disposer de contenus assez proche les uns des autres. Pour les classer en catégorie (text mining pour les données marketing, ou encore pour de la veille technologique), je vais devoir aller plus loin que simplement la catégorie "text mining". En réalité, le text mining est mon contexte et tous les contenus sont proches en termes de sens de cette notion. C'est bien les différents aspects du text mining qui m'intéresse. Je dois alors creuser ce sujet, pour dissocier les différents cas d'usages de text mining. Pour classer ces sujets, je vais donc dissocier des thématiques qui ont un sens proche.

A l'inverse, je peux aussi avoir des contenus parlant de fouille de texte, mais aussi de génération automatique de texte ou encore de voice to text par exemple. J'ai donc un contexte autour de la donnée textuelle mais pas forcément du text mining. Les sens sont moins proches car ils abordent d'autres aspects que le text mining. Pour classifier ces sujets, je vais plutôt chercher des sens plus larges, et sortir du contexte de text mining.

 

L'analyse textuelle avec l'IA My_Knowledge vous permet d'avoir cette granularité. C'est vous qui choisissez le regroupement plus ou moins proche de chaque contenu. Selon le niveau de proximité souhaité, vous disposez de sujets qui sont plus ou moins proches. Si l'on prend notre exemple avec les contenus à propos de la donnée textuelle, vous pouvez configurer la plateforme pour avoir les sujets à proximité élargie (text mining, voice to text, génération de texte), mais aussi des sujets très spécifiques très proches les uns des autres (text mining et marketing, text mining et IA...).

Cela vous permet d'avoir une exhaustivité et de comprendre toutes les grandes tendances, sous tendance et d'avoir toutes les facettes de chaque thème abordé. En fonction de la proximité définie, je ne vais pas voir les mêmes thématiques et c'est comme cela que je comprend l'ensemble des sujets abordés.

granularité dans l'analyse de données textuelles
Ici par exemple on demande à ce que les contenus soient à minima proches de 75% pour créer une thématique (appelée cluster par la plateforme)

Les avantages de My_Knowledge comparés aux autres outils d'analyse de données textuelles

Pas de prétraitement des données textuelles

Aucun prétraitement des données n'est nécessaire. Ce qui compte est le sens général du contenu, l'IA s'affranchit ainsi de la ponctuation, fautes d'orthographes, ou tout autre étape de "cleaning" au préalable.

Plateforme simple à utiliser sans configuration

Un simple import de vos données par un fichier csv. Pas d'installation, pas de configuration vos données sont prêtes à être analysées. Vous définissez par la suite la proximité et la plateforme rapproche vos contenus de manière automatisés. L'analyse de données textuelles n'a jamais été aussi simple.

Analyse de données textuelles automatisées de grands volumes en très peu de temps

Cela ne prend que quelques minutes à la plateforme pour analyser vos données textuelles. Vous pouvez aussi faire de la fouille de texte ou de l'extraction d'informations textuelles de la même manière. My_Knowledge se base sur un algorithme puissant qui permet d'analyser de grands volumes de données textuelles rapidement.

Faites "parler" la donnée

Avec My_Knowledge, vous êtes assuré de faire des découvertes. Ceci vient du fait que nous partons de la donnée pour trouver des insights et non l'inverse. Nous n'utilisons pas de plan de classement au préalable. L'objectif est d'abord de voir quels sont les sujets abordés, pour ensuite décider de ceux qui seront pertinents pour vous. La finalité étant d'identifier les données textuelles pertinentes dans l'amas de données textuelles existant au sein de votre organisation.

Effectuez votre analyse de données textuelles avec la plateforme My_Knowledge

Vos données  s'organisent seules

IA analyse de questions ouvertes

Vous disposez de tous les sujets abordés automatiquement et par proportion.

La plateforme My_Knowledge classera par la suite automatiquement les idées qui ont un sens commun.

Donnez du sens à vos contenus

résultats questions ouvertes mises à disposition dans un tableau de bord

L'Intelligence Artificielle inspirée de la cognition humaine My_Knowledge repose sur le principe de proximité.

Ainsi, c'est le sens global et le contexte qui est pris en compte peu importe les termes utilisés, fautes d'orthographes, acronymes...

Tableau de bord qualitatif

Dashboard

En structurant les réponses, les idées et opinions exprimées par les répondants sont mises à disposition au sein de tableau de bord interactifs. Ces résultats seront croisés avec les données des répondants (age, CSP, ville...) pour une analyse approfondie.

Analyse en masse en toute simplicité

La plateforme permet d'analyser un très grand nombre de verbatims rapidement sur des milliers ou des millions de contenus. Les données s'organisent d'elle-mêmes, et permettent donc de démarrer immédiatement une analyse à partir des contributions récoltées

Analyse textuelle : Cas d'usages

Les cas d'usages sont multiples. Les données textuelles vous apportent les insights nécessaires au développement de votre activité à tous les niveaux. Vos différents logiciels en interne (ERP, CRM...) regorgent de données textuelles qui ne demandent qu'à être analysé. Tous les jours des échanges de données textuelles se font (compte rendu, email, reporting) en interne comme en externe. Vos clients sont en constante interaction avec vous. Que ce soit par le biais de sollicitation de votre part (questionnaire), ou de leur propre initiative (contact, réclamation..).

 

Toutes ces données sont bien entendu analysé individuellement par un opérateur. Néanmoins elles contiennent beaucoup plus de valeur quand elles sont analysés globalement.

Un cas d'usage en vidéo : Analyse de compte-rendus d'intervention

Vous voulez découvrir la valeur existante dans vos données textuelles ?