Etalab : fer de lance de la culture de l’innovation et du numérique au sein de l’État français

Rencontre avec Laure Lucchesi, directrice de la mission Etalab.

L’ouverture des données ou l’open data, est à la fois un mouvement, une philosophie d’accès à l’information et une pratique de publication de données librement accessibles et exploitables.
Poussée par l’émergence des nouvelles technologies, certains gouvernements ont participé à une vague d’ouverture dans les années 2000, parmi lesquels, les États-Unis, le Royaume-Uni, l’Australie, le Canada puis la France font figure de pionniers.

Ouverture et transparence de l’action publique
En France, le droit à l’accès à l’information a été consacré dès 1978 avec la loi CADA, mais il faudra attendre 2010 pour voir les premières collectivités se saisir du sujet et lancer un mouvement proactif d’ouverture des données, avec Rennes puis Paris, qui lancera le portail « Paris Data » en janvier 2011.
Cette même année, la mission interministérielle Etalab rattachée au Premier ministre est lancée. Elle doit contribuer à la modernisation de l’action publique et à la transformation numérique de l’Etat. Tout commence avec la création de la plateforme de données publiques ouvertes data.gouv.fr, destinée à rassembler et mettre à disposition librement l’ensemble des informations publiques de l’Etat, de ses établissements publics et des collectivités territoriales.
La plateforme data.gouv.fr s’enrichira progressivement et deviendra participative dès la fin 2013, illustrant ainsi les principes du « gouvernement ouvert » mis en oeuvre par la mission : ouverture et partage des données publiques ou des codes source des logiciels, transparence de l’action publique, consultation et concertation avec la société civile et les citoyens pour construire la décision publique, innovation ouverte, transparence des algorithmes avec l’arrivée de l’Intelligence artificielle… C’est donc une action publique plus participative et plus collaborative qui voit le jour.

Vers une gouvernance des données renforcée
En plus de cette ouverture, c’est l’essor des sciences des données qui est favorisé : les données produites par les systèmes d’information de l’État doivent être partagées le plus fréquemment possible, mais aussi davantage utilisées par les administrations pour que l’État puisse prendre de meilleures décisions et ainsi mieux piloter son action.
Etalab contribue donc à améliorer l’évaluation des politiques publiques et travaille plus globalement à la gouvernance des données, en visant la production et la diffusion de données de qualité. Pour y parvenir, les datasciences vont permettre de traiter et d’analyser les données, le machine learning va permettre de développer du prédictif et l’on pourra constituer des hubs de données avec des partenaires privés, publics, et travailler avec les autres ministères.
Pour aller plus loin, il sera nécessaire de lancer une réflexion internationale sur la gouvernance des données, vaste débat dans lequel la France aura des positions fortes à tenir. Avec l’abondance de la donnée, les risques d’enfermement et de détournement de celle-ci sont très élevés. La régulation en matière de donnée est, elle aussi, un enjeu majeur.La consultation ouverte en juillet1 sur les états généraux de la régulation sera l’occasion d’aborder ces questions essentielles de gouvernance et de régulation des données.

Des méthodes agiles
La transformation numérique appelle inévitablement à des changements culturels dans les administrations. Cela passe par l’arrivée de nouveaux talents et de nouveaux profils issus de l’univers numérique, comme les développeurs, des codeurs, ou les data scientists mais aussi des diplômés en sciences politiques ou encore des sociologues…
Ces nouvelles compétences ont permis de déployer des méthodes agiles au sein d’Etalab et plus largement d’initier au sein de la DINSIC* les startups d’État ou l’incubateur de services numériques. Une approche pionnière de cette pratique de l’agile au sein de l’administration.

Quid de la sécurisation des données ouvertes
Toutes les données ne nécessitent pas de niveau de sécurité fort ou substantiel : l’open data repose par définition sur une diffusion volontaire des données.En revanche, certaines d’entre elles sont considérées comme des données de référence depuis la loi pour une République numérique, parce qu’elles sont par exemple très utiles pour les collectivités, les administrations, les entreprises… et font office de références communes : les identifiants d’une entreprise, le libellé et la géolocalisation d’une adresse etc. Elles doivent donc bénéficier d’un niveau d’accessibilité garantie : pour que l’économie utilise ces données, leur fiabilité et leur intégrité doivent être assurées. Par exemple, si le numéro de SIRET et les informations concernant le statut d’une entreprise répondant à un appel d’offres sont faussées, c’est tout un pan de l’économie qui peut en pâtir. Il y a donc là un certain niveau de criticité, et des dispositifs techniques adaptés pour assurer la fiabilité et la disponibilité de ces données.Il est important de rappeler que l’ouverture des données issues d’une plateforme ou d’un système d’information ne signifie pas que le système lui-même est ouvert à tous les vents. Les dispositifs habituels de cybersécurité restent en place pour que les plateformes elles-mêmes ne puissent pas être altérées. Concernant les codes sources des logiciels ouverts, il faut s’assurer que, comme pour les logiciels libres de référence, l’ouverture soit un facteur de sécurisation et non de failles, de vulnérabilités. Etalab travaille donc, avec des partenaires comme l’ANSSI sur des audits avant le changement de statut d’un code source, sur la définition des périmètres du code ouvert afin d’isoler les éventuels champs de vulnérabilités. En matière de data lake enfin, l’ensemble est hébergé sur des serveurs privés sécurisés.

Données ouvertes et intelligence artificielle
Sans données de qualité, la puissance de l’intelligence artificielle ne sera pas exploitée. Dans le même temps, les données publiques françaises ne doivent pas être exploitées par n’importe quelle intelligence artificielle. Il s’agit là d’un enjeu de souveraineté numérique. Au coeur de l’Etat et de la sphère publique, un « Lab IA », pluridisciplinaire, est en train d’être créé. Il va permettre de réfléchir sur le long terme sur ce que doit être l’IA de la sphère publique. A titre illustratif, les équipes d’Etalab sont d’ores et déjà intervenus pour appuyer les forces de sécurité sur le sujet de la police prédictive, afin de localiser sur des cartes numériques les vols de véhicules, de mieux les prédire et de mettre en place sur le terrain des stratégies de lutte et de prévention efficaces, tenant compte des pratiques et de la réalité du métier des agents sur le terrain.
Comme l’a souligné le Président de la République à l’occasion de la remise du rapport de la mission Villani, l’Etat doit pleinement se saisir de cette question et être en mesure d’intégrer l’intelligence artificielle pour la conduite des politiques publiques et de ses missions. Classification automatique d’images, reconnaissance d’entités nommées dans des textes, extraction automatique d’informations à partir de données non structurées, les technologies d’IA peuvent avoir un impact important sur l’action publique. Il est indispensable que la puissance publique se sensibilise à toutes les questions liées à l’IA, dès aujourd’hui, pour faire les bons choix.
Dans cette bataille de la donnée, lorsque l’on voit les annonces de certains Etats ou de certains acteurs, il est évident que les rapports de force ne sont nous pas favorables. Les grandes plateformes, américaines notamment, tiennent une place prépondérante. Mais il ne faut pas partir perdants, et il est urgent d’accélérer le mouvement. La France, l’Europe, ont encore les moyens de peser sur les sujets d’Intelligence Artificielle. Il faut pour cela une mobilisation financière, stimuler la recherche et les instituts pluridisciplinaires, mettre en œuvre des stratégies sectorielles avec une mise en commun des données dans ces secteurs, et une montée en compétences de l’administration publique.
La coopération internationale est là encore un enjeu majeur et il faudra circonscrire les zones de coopérations possibles. Un challenge des plus complexes à relever nous attend !