Comment choisir une plateforme de veille ? La capitalisation
La phase de capitalisation consiste à qualifier et sauvegarder des informations “brutes” jugées intéressantes. Après avoir examiné les fonctionnalités essentielles d’un outil de veille pour les phases de sourcing, collecte et les phases d’analyse, nous allons nous pencher maintenant sur cette 3ème étape du cycle de veille.
A l’instar de la collecte et de la surveillance, les logiciels de veille évolués proposent un certain nombre de fonctions d’automatisation afin de gagner du temps sur les tâches de capitalisation comme la qualification, classification et sauvegarde de l’information. Des algorithmes classiques et maintenant des algorithmes d'apprentissage automatique (machine learning) permettent au veilleur et à l'analyste de gagner davantage de temps encore.
Cette phase de capitalisation n’est pas anodine et ne constitue pas un simple “archivage”. Elle prépare en effet la phase de partage puis la phase de diffusion de l’information. De sa précision dépendront donc la qualité de l’étape collaborative puis des livrables de veille.
Regardons les fonctionnalités qu’une plateforme de veille doit proposer pour la capitalisation.
I. Le processus de capitalisation de l'information
L’origine de l’information
Si votre outil de veille est perfectionné, l’information à capitaliser pourra avoir 5 types d’origine :
- Le web : le web visible, les réseaux sociaux, le web profond et le dark web
- Le “terrain” : l’information issue de salons, conférences, visites commerciales
- Les bases de données “tierces” : base de données spécialisées comme Factiva, Kantar, ScienceDirect…
- Les données internes à l’entreprise : données client, marketing, commerciale, production
- L’ajout manuel issu d’une lecture dans la presse écrite, radio, TV ou d’une navigation sur le web
2. Veille : de l’info brute à l’information capitalisée
La démarche
La capitalisation des informations au sein d’un process de veille consiste à qualifier, classer et sauvegarder les informations jugées intéressantes et utiles, voire stratégiques.
L’information est au départ une information brute (figure 2) : une actualité, une page web, un post sur les médias sociaux, un tweet, une information terrain, une image sans commentaires, notation ou qualification.
Capitaliser l’information consiste à :
- la sauvegarder : la plateforme de veille extrait alors l’information utile nettoyée des publicités, menus, fenêtre et de tout ce qui peut constituer du bruit sur la source. Cette étape de nettoyage est plus ou moins simple suivant la structure de l’information collectée (hétérogénéîté, dispersion...).
- la “taguer”, commenter, qualifier et catégoriser : il s’agit ici d'étiqueter l’information et/ou de classer l’information dans un dossier, de la noter suivant un certain nombre de critères (voir figure 3) et de l’assortir d’un premier commentaire. "Premier" car la phase de collaboration permettra un second enrichissement par des experts métiers ou d’autres collaborateurs du projet.
Bien entendu, chaque projet de veille voire chaque cellule de veille définit un processus de capitalisation (et donc sa précision et ses étapes) selon son organisation, ses sujets ou le temps/ressources disponibles
- la rendre accessible et requêtable : via un moteur de recherche, il faudra pouvoir rechercher précisément l'information grâce à de multiples critères comme des mots clés, tags et/ou dossiers mais aussi le type de source, le degré d’importance etc (figure 4), l'auteur. Les critères de workflow (à traiter, nouveau, en cours), de priorité et de fiabilité doivent aussi être proposés. Tous ces critères doivent être non seulement présents dans la plateforme mais il convient aussi qu’ils soient modifiables selon vos process et organisation.
3. Veille : exemples de critères de classification d’une information
II. Les formes de capitalisation et classification
Selon les plateformes de veille, le process de capitalisation peut revêtir différents formes plus ou moins longues dans leur utilisation. Les outils de veille les plus performants proposent l’ensemble de ces possibilités.
Les tags
Le tagging va apposer une étiquette de qualification à l’information. Avec ce système, le contenu collecté est “tagué” ou “pré-tagué “ sur la base d’un thésaurus métier personnalisé en fonction de vos besoins (clients, produits, évènements business...etc) : une information collectée sera manuellement ou automatiquement “taguée” en fonction des mots clés qu’elle comportent ou des règles établies par le veilleur (ex: taguer l’information avec le tag ”à surveiller” si la tonalité est négative).
Le tag peut englober l’ensemble des critères de classification évoqués précédemment (figure 3). Les logiciels de veille évolués vont vous proposer des bibliothèques de tags ou des suggestions de tags selon la nature de l’information que vous souhaitez traiter.
La sauvegarde dans des dossiers
C’est le process le plus classique : l’information qualifiée et commentée sera classée manuellement ou automatiquement dans un ou plusieurs dossiers organisés au sein d'une arborescence thématique et hiérarchisée.
Cette méthode nécessite des fonctionnalités de création d’arborescences à la fois étendues,souples et collaboratives. Le logiciel doit pouvoir permettre en effet une arborescence de dossiers et sous-dossiers illimitée, la duplication, la réorganisation et le déplacement du contenu de l'architecture et de ses dossiers.
Par ailleurs, ces arborescences de dossiers de capitalisation doivent pouvoir être partageables avec des utilisateurs précis, selon des droits d’accès différenciés, selon les thématiques et projets.
Un moteur pour rechercher précisément l'information capitalisée grâce à de multiples critères
Une capitalisation manuelle ou automatique ?
Afin de garder un contrôle totale sur la qualification et la capitalisation de l'information, la plateforme de veille doit laisser le choix et donc la possibilité à l'utilisateur final de gérer ce process avec ou sans assistance des algorithmes. Le veilleur doit ainsi pouvoir sauvegarder et qualifier l’information manuellement : catégorisation, notation, commentaires et tagging.
L’automatisation : Des algorithmes d'automatisation de la classification issues des règles établies par l'utilisateur doivent permettre de classer l'information en mode totalement automatique ou assisté (l’interface vous suggère un dossier ou un tag). Cette classification peut fonctionner via l'attribution automatique de tags et/ou dossiers.
III. Les atouts de l’intelligence artificielle et du machine learning pour la capitalisation
Actuellement, l’Intelligence Artificielle et plus précisément le Machine Learning permettent de perfectionner la capitalisation des informations via un gain de manipulation et de temps appréciables. Ainsi, les logiciels de veille peuvent proposer :
- La Catégorisation automatique paramétrable par algorithme classique (semi-automatique, automatique, par mots clés, par dossier) ou par Machine Learning
- La Recommandations de tags pour qualifier et classifier l'information basé sur les informations déjà lues ou "likées" par IA/Machine Learning
Comment cela fonctionne ?
Le machine learning pour la classification intelligente consiste en un tagging automatisé des mentions fondé sur une logique utilisateur. Lors de la configuration initiale des tags, les utilisateurs se verront proposer un nombre limité de mentions relatives à ces tags, qui leur permettra de confirmer leur pertinence ou non. En prenant en compte cette classification, l'apprentissage automatique combiné avec le NLP (Traitement automatique du langage naturel) permet de comprendre les modèles et caractéristiques des mentions associées à un tag donné et donc de tagger automatiquement toutes les mentions collectées par la suite, pour une organisation rapide et pertinente des données.
Concrètement :
- Après activation laissé à l'appréciation de l'utilisateur, le moteur de Machine Learning va demander à être entraîné
- Le moteur de ML va proposer ensuite un nombre restreint d’articles et leurs tag associés.
- Le moteur va apprendre des validations et invalidations du veilleur et vous proposera ensuite un tagging automatique.
Voilà donc les principaux critères à prendre en compte pour la phase de capitalisation et précisément pour la qualification, enrichissement et la sauvegarde des informations.
Nous aborderons le partage/collaboration, la diffusion et la valorisation des projets de veille via les KPIs dans nos prochains billets.
Ecrit par Christophe Asselin
Christophe est Senior Insights & Content Specialist @ Digimind. Fan du web depuis Compuserve, Lycos, Netscape, Yahoo!, Altavista, Ecila et les modems 28k, de l'e-réputation depuis 2007, il aime discuter et écrire sur la veille et le social listening, les internets, les marques, les usages, styles de vie et les bonnes pratiques.