Les investigations numériques à l’heure de l’IA

Face à des enquêtes de plus en plus complexes dans lesquelles le numérique est toujours plus présent, face à des criminels toujours en avance qui font fi des contraintes éthiques ou légales, l’IA est un outil précieux pour les enquêteurs. A condition de manier ces outils avec précaution, dans le respect de la vie privée, des libertés publiques et individuelles, et d’anticiper des progrès technologiques toujours plus rapides…

Par Marie Rollet

LIA mène lenquête

« Dans le domaine de l’investigation numérique, l’IA offre un potentiel sans précédent pour répondre aux besoins analytiques. Par sa capacité de détection, de classification et d’identification, elle est une assistance précieuse » confie le Général Perrot, coordinateur national pour l’IA de la Gendarmerie Nationale (GN). Face à des volumes de données qui explosent, à la fois hétérogènes dans leur formats et natures et complexes dans leur structure, les enquêteurs peuvent compter sur l’IA pour gagner en efficacité et en rapidité. Machine learning, deep learning, data mining ou langage naturel s’expriment dans des outils d’automatisation, de traitement et d’analyse de données de masse, d’identification faciale ou vocale, de détection de schémas et d’anomalies, etc. La GN a ainsi développé ses propres outils de traitement de données de masse : RosetAI (transcription de texte), NER Annotator (reconnaissance d’entités et extraction de liens sémantiques) Translation tool (traduction)… Des solutions comme Elektron de ChapsVision intègrent déjà ces différentes technologies de traitement de données de masse. L’outil permet, dans des conversations enregistrées, de détecter la langue parlée, de retranscrire et traduire les échanges, identifier et signaler les sujets pertinents pour l’enquête. La capacité de l’IA à identifier des images d’intérêt pour l’enquête est particulièrement utile dans la lutte contre la pédo-criminalité. Le Royaume-Uni a ainsi boosté sa Child Abuse Image Database avec Vigil AI, qui serait capable de détecter et classifier des images d’abus sexuels sur enfants aussi précisément que des experts, mais plus rapidement et sans charge psychologique et émotionnelle. L’identification biométrique bénéficie elle aussi de l’IA et permet de reconnaître voix, visages, ou empreintes digitales dans des bases de données constituées. C’est grâce à son système automatique d’identification biométrique (ABIS) que la police espagnole a pu confirmer l’identité du fugitif El Pastilla, arrêté en 2024 après comparaison d’une image de vidéo-surveillance avec l’ABIS.1

Des applications civiles

Mais l’IA est loin d’être l’apanage des forces de l’ordre. Pour renforcer les contrôles fiscaux, l’administration française utilise data mining pour croiser des données provenant de sources diverses (douane, URSSAF, Infogreffe…) afin d’identifier des incohérences et détecter des erreurs et des fraudes. Quant aux entreprises, « dans le cadre des investigations numériques légales, nous réalisons des recherches en sources ouvertes en appui des enquêtes, que ce soit dans le cadre de due diligence, de fraudes externes ou d’empreintes numériques » rappelle Julien Bouzon, expert investigation numérique légale du Groupe La Poste, et de préciser : « LIA enrichit et améliore la collecte dinformations. Sur des plateformes comme Telegram, les IA génératives peuvent permettre, sous certaines conditions notamment de sécurité et de confidentialité, de programmer des scripts pour automatiser la recherche de contenus ou détecter des schémas dans des conversations et déterminer la nature des échanges ». Les technologies de reconnaissance vocale et de transcription sont aussi d’une aide précieuse. « Lors d’une enquête pour fraude, nous y avons eu recours pour accélérer la lecture et le traitement de 6000 images concernées. Un gain de temps mais aussi de qualité, car nous avons pu traiter lintégralité les images au lieu dun échantillonnage comme nous laurions fait sans IA. » explique l’expert. Chez Mastercard, l’IA générative sert la détection de fraudes financières. Un outil capable de déterminer en temps réel la légitimité d’une transaction suspecte attribue un score de probabilité de transaction frauduleuse, basé sur le comportement du titulaire de la carte. La détection des fraudes aurait ainsi augmenté de 20 % en moyenne.2

Manipuler avec précaution

Certains usages restent toutefois problématiques et inquiètent, comme l’utilisation du logiciel Rekor par la police new-yorkaise pour lutter contre le trafic de stupéfiants. Il permet de reconstituer les itinéraires de véhicules et d’identifier ceux qui empruntent les routes des narcotrafiquants à partir de 480 caméras scannant 16 millions de véhicules par semaine en enregistrant leur plaque mais aussi leur marque et modèle…3Le logiciel de reconnaissance faciale Clearview AI continue lui de faire débat. Il récupère, sans leur consentement, des photos d’utilisateurs sur des plateformes comme Facebook ou Instagram pouvant être comparées à celles de personnes recherchées. Entre 2019 et 2021, la police de Toronto l’aurait utilisé dans 84 enquêtes. 2 auraient même été portées en justice avec des preuves obtenues ainsi. Les commissaires canadiens à la protection des données ont condamné une « surveillance de masse » et une violation de la vie privée.4Aux Etats-Unis, la police aurait déjà effectué plus d’un million de recherches sur Clearview AI.5 Une démarche intrusive qui a déjà conduit à des erreurs d’identification, comme celle qui a mené à l’arrestation de Randal Reid en 2022.

Pour éviter ces écueils, maîtriser l’origine des données d’entraînement, contrôler les algorithmes utilisés et leur paramétrage et prévenir d’éventuels biais, la Gendarmerie s’attache à développer en interne certaines de ses applications d’IA. « Nous avons un devoir de redevabilité vis à vis de la population » rappelle le Général Perrot. Et de poursuivre : « Il faut manier l’IA avec responsabilité, sans en obérer l’usage par une réglementation qui nuirait à la protection des populations au bénéfice de la délinquance. » Et toujours sous le contrôle d’un magistrat, dans le respect du RGPD et bientôt de l’IA Act. La GN a aussi publié une charte éthique de l’IA, pour s’assurer qu’elle agisse bien comme une force positive au service du citoyen.Un souci d’usage raisonné et responsable de l’IA partagé par La Poste : « Nous soumettons son utilisation à 4 critères : légalité, faisabilité technique, sécurité, et éthique. » indique Julien Bouzon.

Un futur prometteur

« L’IA sera d’un apport considérable dans les années à avenir dans l’espace cyber. Notamment pour authentifier les informations contenues sur des supports numériques, quand l’IA générative et les larges modèles de langages (LLM) renversent le rapport à la véracité de l’information. » soutient le Général Perrot. Les LLM ouvrent pourtant aussi de nombreuses opportunités, comme les recherches en langage naturel ou la génération de résumés qui permettront de « synthétiser des centaines de milliers de pages de procédure en un texte digeste dans un temps raisonnable. » indique Eric Bourry, Chief Architect Officer chez ChapsVision. L’IA est aussi au coeur de l’approche prédictive de la Gendarmerie. Elle facilite notamment l’analyse de masse d’informations sur les faits de délinquance et permet d’orienter l’action des forces de sécurité. L’analyse des interventions déjà menées permet de déterminer le nombre de patrouilles nécessaires pour couvrir au mieux ces interventions à venir et d’optimiser l’empreinte terrain. Aucun risque toutefois que l’IA ne remplace l’enquêteur : « Il reste peu probable qu’une IA soit en mesure de satisfaire à la fois à la pluridisciplinarité de l’enquête et à la subjectivité des variables entrant en jeu. L’IA ne doit être considérée que comme un outil à la disposition de l’enquêteur, le cerveau reste plus déterminant que l’outil. » rassure le Général Perrot.

1 Detalle nota de prensa. Policía Nacional España. (policia.es)

2 Mastercard utilise l’IA générative pour détecter les fraudes financières – ZDNet

3 This AI Watches Millions Of Cars And Tells Cops If You’re Driving Like A Criminal (forbes.com)This AI Watches Millions Of Cars And Tells Cops If You’re Driving Like A Criminal (forbes.com)

4 Toronto police used Clearview AI facial recognition software in 84 investigations | CBC News

5 Clearview AI used nearly 1m times by US police, it tells the BBC – BBC News