Become Information Driven

Par Mélanie Bénard-crozat

« Pour adresser les enjeux opérationnels et stratégiques de l’entreprise et des institutions, il est primordial de tirer bénéfice des données massives, hétérogènes et pour la plupart d’entre elles textuelles qui gravitent dans leur paysage informationnel. La transition de la donnée brute à l’information qualifiée est un défi qui requiert l’emploi de technologies de l’information très avancées combinant le NLP (analyse linguistique) et le machine learning. » explique Luc Manigot, Directeur des Opérations, Sinequa

Passer d’un modèle « data-driven » à « information-driven » avec le cognitive search & analytics, voici ce que propose Sinequa, PME française reconnue leader en « cognitive search & knowledge discovery » par Forester et dans la catégorie « Insight Engines » par Gartner.

Cognitive search & analytics
L’objectif est depasser du big data à une information plus qualifiée et plus riche. Il s’agit donc de combiner intelligemment la puissance de la collecte de données massives et hétérogènes, de l’indexation sémantique, du text-mining, de l’intelligence artificielle et du search et tout cela « en une plateforme unique au profit des collaborateurs d’une entreprise ou d’une institution » ajoute Luc Manigot et de poursuivre « notre plateforme de “Cognitive Search & Analytics” combine ces différentes technologies pour permettre aux utilisateurs des grands comptes, privés ou publics, de devenir « Information-Driven » et ainsi prendre des décisions plus avisées, optimiser leur productivité et efficacité opérationnelle, mieux répondre aux besoins de leurs clients, adresser les enjeux de sécurité et enfin connaître une plus grande satisfaction au travail. »

Cette plateforme contribue à l’extraction et à la diffusion d’informations à l’appui de cas d’utilisations multiples, notamment pour trouver des experts, fournir des informations à 360 degrés sur des sujets, prévenir la fraude et extraire des données à des fins d’analyse.

De la donnée à l’Information

Selon Gartner, « les Insight Engines » amènent la technologie de recherche à un autre niveau grâce à l’intelligence artificielle qui permet de créer des expériences proactives, pertinentes et contextuelles, avec des données et du contenu provenant de plusieurs sources. « Lorsque vous avez trouvé les données, les Insight Engines vont utiliser des connecteurs pour explorer et indexer le contenu de sources multiples. Nous en avons plus de 180 chez Sinequa » souligne Luc Manigot

et de poursuivre « la configuration de ces connecteurs permet de rassembler toutes les données connues vers un point de ralliement central par un mécanisme d’indexation, sans pour autant les recopier physiquement »

Il faut ensuite catégoriser ces données, les comprendre, les mémoriser, les sécuriser et les nettoyer. « Cela vous permet d’extraire le texte et les métadonnées associées, de façon très contextuelle. Cette donnée, nous allons ensuite la porter à la connaissance de l’utilisateur avant d’entrer dans la phase d’interprétation. A ce stade, vous êtes devenu Data Driven. » explique Luc Manigot.

Une fois que cette connectivité est assurée, deux approches complémentaires s’imposent pour passer du data-driven à l’information-driven : le traitement linguistique des données du Cognitive Search se combine au Machine Learning : la capacité des ordinateurs à apprendre à mesure qu’ils traitent l’information, pour offrir des résultats de plus en plus pertinents et organisés.

Il faut aussi adresser le challenge du multilingue. « Aujourd’hui, sans un traitement et un travail de préparation des données, vous ne pouvez pas produire d’Informations utiles à l’utilisateur. » ajoute Luc Manigot et de poursuivre « Il faut donc enseigner au système des éléments que l’on sait déjà, l’analyse des langues, la capacité d’introduire des règles de classement, des règles d’extraction de texte, en somme de rendre la machine plus intelligente. »

Vient ensuite la phase d’auto-apprentissage grâce à la donnée elle-même qui revient à ajouter de l’intelligence à un dispositif existant de remontée d’information. « En ajoutant des règles explicatives puis du machine learning et des couches de présentation astucieuse pour faciliter l’interaction avec les données, on réduit ainsi la charge de travail de l’humain. »

Au service du renseignement

« La puissance de l’outil, au service de l’efficacité opérationnelle des services de renseignement, peut ainsi faire croître de façon exponentielle leur analyse prédictive. Cet apprentissage cognitif permet de s’adapter à la sophistication constante des techniques du renseignement, que sont la lutte contre le terrorisme, le blanchiment d’argent, la fraude… » précise Laurent Fanichet, Vice-Président marketing de Sinequa. Ces plateformes de Cognitive Search qui évoquent aussi celles de l’américain Palantir permettent donc y compris pour les loups solitaires « l’exploitation des traces, qu’ils laissent immanquablement sur internet. Il est possible de détecter des schémas comportementaux, et de prévenir ainsi le passage à l’acte. » ajoute Laurent Fanichet.

Le Cognitive Search permet de renforcer la lutte contre le blanchiment d’argent, l’une des principales sources de financement du terrorisme. « La technologie des Insights Engines permet de croiser les données, en particulier les données financières, telles que des numéros de comptes, de cartes ou des transferts de fonds, pour repérer les activités frauduleuses. » complète Luc Manigot.

Le retrait des contenus terroristes

Pour traquer le crime organisé, surveiller les réseaux sociaux, les forums de discussions, les blogs et autres outils de communication digitaux, les plateformes de Cognitive search & analytics sont un moyen essentiel pour pouvoir détecter des profils en voie de radicalisation et avoir un aperçu en temps réel de menaces potentielles. Ces services de renseignement s’appuient alors sur l’Open-Source Intelligence.

Lors du conseil justice et affaires intérieures de l’Union européenne qui s’est tenu en décembre dernier à Bruxelles, sur le projet de règlement pour le retrait de contenus terroristes en ligne, il a été arrêté la position de négociation sur la proposition de règlement relatif à la prévention de la diffusion en ligne de contenus à caractère terroriste. « Le retrait des contenus terroristes en ligne est essentiel. Internet est un espace virtuel qui, comme l’espace réel, ne peut être une zone de non-droit. C’est pourquoi nous nous réjouissons de l’aboutissement des négociations sur la proposition législative de la Commission visant à retirer les contenus terroristes en ligne dans un délai d’une heure seulement après leur signalement. La présentation de ce projet de texte par la Commission européenne répondait d’ailleurs à une demande de longue date de la France et de l’Allemagne (…) » précisait en décembre dernier Laurent Nunez, le secrétaire d’Etat auprès du ministre de l’Intérieur et d’ajouter « le dialogue coopératif avec les opérateurs de l’internet devra par ailleurs se poursuivre au sein du Forum UE de l’Internet, notamment pour favoriser la mise en place de mesures pro-actives de détection de contenus terroristes. »

Cela constitue pour des entreprises comme Sinequa de nouvelles opportunités de développement « la réactivité demandée – le délai d’une heure – appelle en effet à intégrer des solutions automatisées, et des technologies associant le NLP, le machine learning et l’intelligence artificielle pour répondre aux attentes des autorités » précise Luc Manigot.

Mais cette réglementation invite aussi à se poser des questions soulevées par la Quadrature du net ou encore le Cloud Infrastructure Services Providers in Europe (CISPE) sur les définitions du terrorisme, les cadres règlementaires et législatifs différents dans les différents pays de l’UE ou encore le rôle de police confié à des acteurs privés du net dont ce n’est pas la vocation initiale… Enfin, au-delà des questions de protections des données personnelles et libertés individuelles, celle de la facture énergétique s’invite dans les débats. Une telle démarche nécessitera une puissance de calcul hors norme et une consommation énergétique accrue. Dans un contexte de fragilité écologique planétaire, l’enjeu est aussi d’allier les innovations du numérique à des démarches plus responsables. « Le numérique peut tout autant augmenter notre empreinte écologique que nous apporter les opportunités pour la réduire et accélérer la transition ». soulignait Pascal Canfin, directeur général de WWF France. Il semble donc que les algorithmes aient déjà anticipé et apporté des réponses à cette question. Grâce à des recommandations réalisées à l’aide d’algorithmes, les géants du web parviendraient à réduire la consommation de leurs propres centres de données de 15 %. Les nouvelles technologies offriront donc peut-être le remède à leur propres maux.