La phase de capitalisation consiste à qualifier et sauvegarder des informations “brutes” jugées intéressantes. Après avoir examiné les fonctionnalités essentielles d’un outil de veille pour les phases de sourcing, collecte et les phases d’analyse, nous allons nous pencher maintenant sur cette 3ème étape du cycle de veille.
A l’instar de la collecte et de la surveillance, les logiciels de veille évolués proposent un certain nombre de fonctions d’automatisation afin de gagner du temps sur les tâches de capitalisation comme la qualification, classification et sauvegarde de l’information. Des algorithmes classiques et maintenant des algorithmes d'apprentissage automatique (machine learning) permettent au veilleur et à l'analyste de gagner davantage de temps encore.
Cette phase de capitalisation n’est pas anodine et ne constitue pas un simple “archivage”. Elle prépare en effet la phase de partage puis la phase de diffusion de l’information. De sa précision dépendront donc la qualité de l’étape collaborative puis des livrables de veille.
Regardons les fonctionnalités qu’une plateforme de veille doit proposer pour la capitalisation.
Si votre outil de veille est perfectionné, l’information à capitaliser pourra avoir 5 types d’origine :
2. Veille : de l’info brute à l’information capitalisée
La capitalisation des informations au sein d’un process de veille consiste à qualifier, classer et sauvegarder les informations jugées intéressantes et utiles, voire stratégiques.
L’information est au départ une information brute (figure 2) : une actualité, une page web, un post sur les médias sociaux, un tweet, une information terrain, une image sans commentaires, notation ou qualification.
Capitaliser l’information consiste à :
- la sauvegarder : la plateforme de veille extrait alors l’information utile nettoyée des publicités, menus, fenêtre et de tout ce qui peut constituer du bruit sur la source. Cette étape de nettoyage est plus ou moins simple suivant la structure de l’information collectée (hétérogénéîté, dispersion...).
- la “taguer”, commenter, qualifier et catégoriser : il s’agit ici d'étiqueter l’information et/ou de classer l’information dans un dossier, de la noter suivant un certain nombre de critères (voir figure 3) et de l’assortir d’un premier commentaire. "Premier" car la phase de collaboration permettra un second enrichissement par des experts métiers ou d’autres collaborateurs du projet.
Bien entendu, chaque projet de veille voire chaque cellule de veille définit un processus de capitalisation (et donc sa précision et ses étapes) selon son organisation, ses sujets ou le temps/ressources disponibles
- la rendre accessible et requêtable : via un moteur de recherche, il faudra pouvoir rechercher précisément l'information grâce à de multiples critères comme des mots clés, tags et/ou dossiers mais aussi le type de source, le degré d’importance etc (figure 4), l'auteur. Les critères de workflow (à traiter, nouveau, en cours), de priorité et de fiabilité doivent aussi être proposés. Tous ces critères doivent être non seulement présents dans la plateforme mais il convient aussi qu’ils soient modifiables selon vos process et organisation.
3. Veille : exemples de critères de classification d’une information
Selon les plateformes de veille, le process de capitalisation peut revêtir différents formes plus ou moins longues dans leur utilisation. Les outils de veille les plus performants proposent l’ensemble de ces possibilités.
Le tagging va apposer une étiquette de qualification à l’information. Avec ce système, le contenu collecté est “tagué” ou “pré-tagué “ sur la base d’un thésaurus métier personnalisé en fonction de vos besoins (clients, produits, évènements business...etc) : une information collectée sera manuellement ou automatiquement “taguée” en fonction des mots clés qu’elle comportent ou des règles établies par le veilleur (ex: taguer l’information avec le tag ”à surveiller” si la tonalité est négative).
Le tag peut englober l’ensemble des critères de classification évoqués précédemment (figure 3). Les logiciels de veille évolués vont vous proposer des bibliothèques de tags ou des suggestions de tags selon la nature de l’information que vous souhaitez traiter.
C’est le process le plus classique : l’information qualifiée et commentée sera classée manuellement ou automatiquement dans un ou plusieurs dossiers organisés au sein d'une arborescence thématique et hiérarchisée.
Cette méthode nécessite des fonctionnalités de création d’arborescences à la fois étendues,souples et collaboratives. Le logiciel doit pouvoir permettre en effet une arborescence de dossiers et sous-dossiers illimitée, la duplication, la réorganisation et le déplacement du contenu de l'architecture et de ses dossiers.
Par ailleurs, ces arborescences de dossiers de capitalisation doivent pouvoir être partageables avec des utilisateurs précis, selon des droits d’accès différenciés, selon les thématiques et projets.
Afin de garder un contrôle totale sur la qualification et la capitalisation de l'information, la plateforme de veille doit laisser le choix et donc la possibilité à l'utilisateur final de gérer ce process avec ou sans assistance des algorithmes. Le veilleur doit ainsi pouvoir sauvegarder et qualifier l’information manuellement : catégorisation, notation, commentaires et tagging.
L’automatisation : Des algorithmes d'automatisation de la classification issues des règles établies par l'utilisateur doivent permettre de classer l'information en mode totalement automatique ou assisté (l’interface vous suggère un dossier ou un tag). Cette classification peut fonctionner via l'attribution automatique de tags et/ou dossiers.
Actuellement, l’Intelligence Artificielle et plus précisément le Machine Learning permettent de perfectionner la capitalisation des informations via un gain de manipulation et de temps appréciables. Ainsi, les logiciels de veille peuvent proposer :
Comment cela fonctionne ?
Le machine learning pour la classification intelligente consiste en un tagging automatisé des mentions fondé sur une logique utilisateur. Lors de la configuration initiale des tags, les utilisateurs se verront proposer un nombre limité de mentions relatives à ces tags, qui leur permettra de confirmer leur pertinence ou non. En prenant en compte cette classification, l'apprentissage automatique combiné avec le NLP (Traitement automatique du langage naturel) permet de comprendre les modèles et caractéristiques des mentions associées à un tag donné et donc de tagger automatiquement toutes les mentions collectées par la suite, pour une organisation rapide et pertinente des données.
Concrètement :
Voilà donc les principaux critères à prendre en compte pour la phase de capitalisation et précisément pour la qualification, enrichissement et la sauvegarde des informations.
Nous aborderons le partage/collaboration, la diffusion et la valorisation des projets de veille via les KPIs dans nos prochains billets.