Les données textuelles : un gisement de valeur peu ou mal exploité
Jusqu’à présent ce sont surtout les données de type chiffre qui sont exploitées. Les méta-données elles sont aussi exploitées sous l’angle quantitatif de façon à exprimer des volumes, des durées, des distances etc… tout cela étant rendu possible grâce à l’évolution des outils d’analyse de données structurées, de l’ancêtre des tableurs aux derniers outils de Business Intelligence les plus sophistiqués comme la Data Visualisation. Ces outils décisionnels apportent énormément de valeur aux organisations. La donnée structurée ou semi-structurée est donc parfaitement gérée aujourd’hui.
Il s’agit maintenant de réaliser que la donnée non structurée de type texte est très fortement présente. Sa présence est beaucoup plus importante au sein de toutes les organisations. Représentant 80% (*) du patrimoine d’informations, son volume ne fait que s’accroitre. Au même titre que la donné structurée, c’est un gisement de valeur important, souvent encore inexploité, pour toutes les entreprises et organisations. Une marge de manœuvre est facilement accessible puisque les entreprises disposent déjà de la matière première.
Parfaitement traitées par les outils de Business Intelligence, les données structurées alimentent les « dashboards » de la plupart des directions des entreprises selon une vision quantitative. Actuellement le volume de données non structurées de type texte a largement dépassé le volume de données structurées et l’écart se creuse de plus en plus au fur et à mesure du temps qui passe.
L’approche qualitative étant laissée de coté pour ces immenses volumes, les organisations sont démunies face à la nécessité de tirer parti de ces données texte.