Afin d’optimiser son activité, Bercy table sur une programmation efficace des contrôles fiscaux. Son objectif : être présent sur les enjeux financiers les plus lourds et les nouvelles formes de fraude.
Outre les formes usuelles de détection des dossiers frauduleux, la Direction générale des Finances publiques (DGFIP) s’intéresse désormais à de nouvelles modalités d’exploitation des données, notamment les outils de datamining (exploration des données).
Une cellule spécialisée
La mission « requêtes et valorisation », composée de data scientists, effectue des travaux permettant de caractériser une personne ou une entreprise frauduleuse et d’établir un profil de fraude qui sera appliqué à une population cible. Cette mission recueille des informations issues des applications professionnelles, personnelles et patrimoniales de la DGFiP pour détecter certaines anomalies, comme des incohérences entre différentes déclarations.
L’intelligence artificielle
Dans cette démarche, la mission bénéficie d’un outil informatique puissant, développé dès 2014 : le CFVR (pour Ciblage de la Fraude et Valorisation des Requêtes). Le CVFR explore les informations de 11 bases de données, comme Sirius-Pro, le logiciel de contrôle fiscal de la Direction générale des finances publiques (DGFiP), ou le Bulletin officiel des annonces civiles et commerciales (Bodacc). En s’appuyant sur des méthodes exploratoires basées sur la statistique et des algorithmes et en permettant de modéliser des comportements, cet outil utilise les techniques de l’intelligence artificielle pour identifier de façon automatique des cas de fraudes fiscales possibles.
Des résultats prometteurs
Concrètement, la mission « requêtes et valorisation » établit des listes de contribuables cibles qu’elle transmet chaque semestre aux services chargés du contrôle. Ainsi, à partir des listes transmises en 2017, plus de 22 700 contrôles sur pièces ont été déclenchés. Ils ont permis de récolter plus de 100 millions d’euros de rappel de droits et pénalités.
Si les premières cibles du CVFR étaient les entreprises et leurs dirigeants, le dispositif s’est étendu aux particuliers. Avec le projet de loi de Finances pour 2020 qui va permettre, à titre expérimental, la collecte de données à caractère personnel publiées sur internet par les utilisateurs de plateformes en ligne, les data scientists vont pouvoir encore affiner leur méthode d’identification des fraudeurs. Dans un premier temps Bercy s’est engagé à ne procéder à aucun contrôle automatisé à partir des traitements mis en œuvre sur ces données personnelles.