L’intelligence artificielle au cœur de la vidéo-détection

Si lhomme reste au centre des prises de décision, lIA simpose peu à peu comme une actrice incontournable de la détection et de lanalyse dimages. Alors qu’elle pourrait jouer un rôle central dans la sécurisation des Jeux Olympiques et Paralympiques de 2024, décryptage des avancées technologiques dans ce domaine avec les experts d’Axis Communications.

Par Maya Wall

Le domaine de l’intelligence artificielle existe en tant que discipline académique depuis 1956. Plus de 65 ans plus tard, l’IA et ses capacités de deep learning se développent rapidement dans les domaines de la surveillance et de la détection où nombre de fonctionnalités sont déjà disponibles. « Détection d’anomalies en temps réel, aide à la décision, comptage de personnes, détection de postures, interfaces ergonomiques, détection des armes à feu en environnement urbain, classification automatique des menaces… les opportunités permises par l’IA et le deep learning sont de plus en plus nombreuses » témoigne Frédéric Flessati, Responsable commercial Grands Comptes chez Axis Communications et d’ajouter : « Des algorithmes assez simples commencent par faire de la catégorisation automatique d’êtres humains ou de voitures. La détection d’intrusion sur caméra thermique pour la protection périmétrique de site est une fonction très largement utilisée et donne de très bons résultats. Plus complexes, il existe des algorithmes de lecture de plaques d’immatriculation mais aussi de reconnaissance de véhicules (type, marque, modèle, vitesse, sens de déplacement)… » Dans un aéroport, en cas de suspicion d’un bagage abandonné, l’IA peut permettre de relier le bagage à un individu et confirmer ou non son abandon mais cela gagne encore à être approfondi et amélioré.

Actuellement, l’analyse locale des images dans les caméras de surveillance à détection de mouvement vidéo détermine si un objet ou un individu se déplace. Après une analyse plus approfondie par un système de gestion vidéo (VMS), un opérateur humain interprète exactement l’origine du mouvement et évalue s’il présente une menace ou un risque pour la sécurité. Néanmoins, grâce au machine learning et au deep learning, une caméra peut « apprendre » à classer automatiquement certains objets. « Les opérateurs peuvent ainsi se recentrer sur les menaces réelles et non plus sur l’ondulation de la végétation, la projection d’ombres fugaces, etc. Les objets classifiés sont envoyés sous forme de métadonnées au logiciel VMS pour analyse complémentaire par un opérateur humain ou pour déclencher des actions automatiques reposant sur des règles prédéfinies. Comme l’analyse initiale a lieu dans la caméra et non sur un serveur ou dans le cloud, il est possible d’économiser une bande passante précieuse, car seules les données d’intérêt sont transmises sur le réseau. » explique Frédéric Flessati.

Les métadonnées créées en même temps que les images vidéo – essentiellement des données sur les images – constituent une avancée majeure. « Depuis lannée dernière, avec larrivée du programme ACAP 4 (AXIS Camera Application Platform version 4), lusage de Docker, Python et du forum Github permettent de faciliter et de démultiplier le développement dapplications IA embarquées dans nos produits. Nous en comptons aujourd’hui plus de 117. » précise Frédéric Flessati.

Imminence des grands événements

Un peu moins de 50% des caméras devraient, à horizon des Jeux Olympiques et Paralympiques de 2024, embarquer des applications à base de deep learning.Axis affirme déjà pouvoir se positionner sur la sécurisation des Jeux au travers de ses solutions existantes d’analyse vidéo et d’intelligence artificielle, telle que la détection d’intrusion, la vidéoverbalisation ou encore le comptage de véhicules et de personnes couplées aux contrôles d’accès des personnes accréditées par QR code, à la vidéosurveillance des sites de compétition et d’entraînement, des villages des athlètes et des médias. De son côté, la SNCF compte utiliser l’intelligence artificielle pour détecter automatiquement des mouvements suspects sur les images des caméras, afin d’épauler les agents de surveillance de la SUGE en nombre nécessairement limité. Mais il va falloir équiper toutes les gares de France qui ne sont pas logées à la même enseigne en matière de connectivité et de système vidéo. La région Ile-de-France, qui accueillera une grande partie des sites de compétitions en 2024, est la première à se positionner sur le terrain de la vidéoprotection dans les transports. Un centre de commandement unique de la police des transports pour visionner les images des 80 000 caméras installées sur le territoire est d’ores et déjà actif. Ce système, basé à la Préfecture de Police, est, selon les mots de la présidente de la région IDF, Valérie Pécresse « unique en Europe » et d’ajouter : « ce système a réalisé près de 30% des flagrants délits. Il détecte les pickpockets qu’on ne voit pas à l’œil nu. Il détecte les harceleurs de femmes ». Le Réseau Multi-Services est quant à lui un système de communication sécurisé desservant toutes les gares, les tunnels et les ouvrages de service. Il permet la communication à très haut débit entre le poste de commande centralisé qui supervise les métros automatiques, les rames et l’ensemble des équipements soit près de 13 000 caméras, 11 000 accès contrôlés ou encore 975 bornes d’appels. Ce dernier devrait notamment permettre d’intégrer des solutions innovantes comme la Détection Automatique d’Incidents (DAI) utilisant des algorithmes intelligents d’analyses d’images pour déceler automatiquement des colis suspects, des fumées ou départs de feu, des mouvements de foule, etc.

Mais certaines questions autour de l’utilisation de l’intelligence artificielle restent encore en suspens. La loi française, comme le cadre législatif européen, encadrent ces technologies, mais pour développer cette intelligence artificielle, « on a besoin de faire évoluer la loi » assure Valérie Pécresse. Demandant un débat national « sur le recours à l’intelligence artificielle, sans reconnaissance faciale », elle souhaite « qu’à l’entrée des gares, on puisse matcher le visage des gens qui passent avec le fichier des personnes condamnées ou recherchées pour des actes terroristes », comme cela existe déjà dans les aéroports. Il ne s’agit pas d’enregistrer les visages, assure-t-elle, « il n’y a pas de conservation de la donnée. »1

Approche partagée par Axis qui sur la reconnaissance faciale, atteste « techniquement, la reconnaissance faciale fonctionne très bien. Il nest évidemment pas question de restreindre les libertés publiques de la population, mais dassurer la sécurité dun grand événement en sappuyant sur des technologies qui ne portent pas atteinte aux données personnelles des citoyens. »

Intention éthique

Evidemment tout n’est pas encore possible – et il y a fort à parier que, pour garder des technologies de détection à base d’IA responsables et éthiques, il faudra accepter que certains usages ne seront probablement jamais envisageables. « Avec l’évolution des processeurs, les possibilités vont évoluer rapidement », Frédéric Flessati en est persuadé. « Mais certains besoins vont être difficiles à concrétiser dun point de vue technique. Cest le cas par exemple des prisons qui souhaiteraient pouvoir détecter des petits objets envoyés par-dessus les murs denceinte. Or, il est très difficile pour une caméra de faire la distinction entre ces petits objets et un oiseau qui passerait par-là. Cette incertitude génèrerait de fausses alertes avec le risque que le client se détourne in fine de loutil de détection. »

Les outils développés aujourd’hui doivent également pouvoir répondre à un impératif de transparence dans la conception même des logiciels et des outils technologiques qui les supportent. « Aujourdhui, on est capable de détecter par exemple une foule qui passerait de statique à mouvante rapidement. Cela peut permettre de détecter un incendie ou des attentats dans des grands rassemblements. » Et de rappeler : « Mais on ne détecte pas lintention avec lanalyse dimages. »

Axis vient par ailleurs d’annoncer, en avril dernier, le lancement d’un projet d’authentification vidéo en open source qui permettra de signer par un modèle cryptographique les vidéos extraites de ses caméras pour ainsi les authentifier et s’assurer de leur intégrité et de leur non-altération.

1 https://www.francetvinfo.fr/economie/transports/video-intelligence-artificielle-et-videoprotection-dans-les-transports-valerie-pecresse-y-est-favorable-et-demande-un-debat-national-sur-les-aspects-ethiques_4647587.html