Tribune d’Odile Quesnel, Responsable ArgusLab et Responsable du services Profils de l’Argus de la presse.
L’Argus de la presse accompagne les organisations dans leur stratégie de développement (Market Intelligence) comme dans leur stratégie de communication (Média Intelligence). L’Argus de la presse permet à ses clients de dégager une vision à 360° de leur marché, d’identifier menaces et opportunités, de détecter et d’analyser des leviers d’innovation, comme de nourrir leur stratégie de communication en surveillant leur marque, en identifiant les relais d’influence, en écoutant les publics cibles et en mesurant l’impact de leur communication.
L’information est donc au coeur de toutes nos activités. Notre terrain de jeux est celui des contenus médias, corporate, ou sociaux sachant que contenus comme émetteurs de l’information sont tout aussi importants et pour lesquels il est important de discriminer ce qui relève de la contagion et ce qui ressort des différentes formes d’éditorialisation cross media.
Notre matière est le big content, ce qui signifie :
- mensuellement, 18 000 heures de radio-TV, 1,3 million de pages presse, plus de 5 millions de pages web et quelques millions de contenus sociaux,
- des contenus non structurés et hétérogènes (forme et langage),
- des contenus médias comme sociaux, en permanence augmentés par les pratiques en ligne de ceux qui lisent et qui commentent,
- des référentiels de natures très différentes (médias, journalistes, influenceurs, annonceurs…) qui doivent «parler» avec ces contenus (100 000 sociétés et institutions, 770 000 marques, 72 000 contacts médias et experts intervenants dans les médias, +25 000 sources qualifiées, etc…)
Nos clients sont en attente de documents de restitution « livrables » ciblés, adaptés aux différents objectifs, d’une simple veille en ligne à l’analyse en passant par l’engagement, les délais de restitution sont très courts et les attentes en matière de service fortes.
Il est donc important pour nos collaborateurs de pouvoir aborder les contenus informationnels selon différents angles d’approche. L’Argus s’est engagée dans une démarche de mise en cohérence de la gestion de l’information de type Big content capable de répondre aux contraintes industrielles. Elle donne au veilleur comme à l’analyste de nouvelles perspectives dans l’analyse des résultats (smart content) et dans la détection de signaux faibles (small content). Les solutions développées par l’Argus de la Presse, en particulier avec everteam.analytics et everteam.case, offre une nouvelle manière de manipuler l’information et ouvrent de nouvelles perspectives analytiques.
Quelles problématiques avons-nous eu à résoudre pour apporter des réponses sur l’ensemble de la chaine de valeur ?
Sourcing :
- Comment automatiser le profilage quand on est confronté à une masse d’information?
- Comment traiter les sources d’information quand celles-ci sont autant des médias que des personnes et repérer le point de départ de l’information ?
Collecte – Approvisionnement :
- Comment pouvoir exploiter des contenus hétérogènes dans leur forme et leur langage adossés à des données structurées et qualifiées ?
- Comment identifier ce qui relève du flux d’information ou du contenu dans un contexte de temps réel ?
Recherche et requêtage :
- Comment assurer des méthodologies de recherche différenciées selon les prestations, des processus itératifs de découverte de l’information ?
- Comment exploiter contenus, sources et émetteurs de manière croisée et optimum ?
Consultation – exploration :
- Comment donner du sens à des données de masse, pouvoir consulter l’essentiel pour comprendre et décider, visualiser en temps réel ?
- Comment ? … en construisant un socle unique permettant le mariage nécessaire des technologies de l’information et de la gestion du document.
Pour créer du sens et aider les professionnels comme les clients finaux, il faut déployer des solutions combinant plusieurs approches et en particulier l’apport du TAL (Traitement automatique de la langue) et de la fouille de données (TDM) à l’interrogation des contenus textuels, pour générer des entités nommées (noms de marque, d’organisation, signataires…), descripteurs thématiques ou encore natures de contenus. Il est alors nécessaire de mixer référentiels et règles formelles issues de l’analyse des corpus.
Il est primordial avant tout d’avoir des données correctement préparées, des contenus « transformés » en données intelligibles, d’avoir la capacité à les intégrer au même titre que des séries de données statistiques au cycle du market intelligence. La taille massive des « échantillons » crée un effet de normalisation et permet des niveaux de confiance plus élevés dans l’affirmation des tendances. Conserver les « données » en contexte pour les croiser et rendre les résultats plus lisibles malgré leur volume par les outils de content analytics permet un premier niveau de visualisation dynamique des relations qui les lient et de leur distributivité.
L’on ne peut construire ce type de plateforme sans une architecture informationnelle digne de ce nom. Il s’agit de dessiner les contours d’un territoire, pas uniquement celui du document mais celui où la personne et le document sont attachés, de mettre l’analyse automatique des contenus et la corrélation des données extraites au cœur de la démarche d’identification et de « profilage » des sources médias.
Il ne s’agit pas de remplacer l’expertise par les algorithmes ; toutefois les professionnels de la veille et de l’analyse ne peuvent pas ne pas les prendre en compte afin d’assurer leur place dans la chaîne de valeur digitale. Quant aux enjeux pour l’Argus de la Presse, ils sont importants car il s’agit d’inscrire ces questionnements dans une démarche industrielle.
Pour conclure, nous dirions que la réussite de ce programme de développement de solutions innovantes a reposé sur plusieurs facteurs :
- une forte et ancienne expertise en matière d’approvisionnement massif de contenus hétérogènes,
- une démarche constante de qualité des données,
- une méthode de gouvernance et de valorisation des contenus comme des données,
- la capacité à orchestrer des technologies très matures pour certaines et bien sûr de très fortes compétences en ingénierie informatique comme en technologies de l’information.