Partager

Sécurité des IA face aux attaques adverses

Les systèmes à base d’intelligence artificielle (IA) sont vulnérables à des menaces tout au long de leur cycle de développement. Les outils PyRAT et PARTICUL développés par le CEA-List permettent de détecter et de se prémunir contre les attaques adverses.

L'usage

Détection d’attaques adverses avec PyRAT et PARTICUL

Les récentes avancées en matière d’intelligence artificielle ont permis une rapide popularisation des systèmes à base d’IA qui font désormais partie de notre vie quotidienne et sont présents dans de nombreux domaines industriels. Comme tout système informatique, les systèmes à base d’IA sont vulnérables à de nombreuses menaces durant tout leur cycle de développement, de la collecte de données en passant par l’entraînement jusqu’à leur déploiement. Dès 2014 leur fragilité face à des attaques adverses a été démontrée, des perturbations ajoutées à l’image permettent d’altérer la décision d’une IA tout en restant imperceptible à l’œil nu. De manière similaire, des attaques dites par patch permettent par un simple sticker positionné à côté d’un objet d’en altérer sa reconnaissance par une IA.

Le CEA-List propose une solution combinant les outils PyRAT et PARTICUL pour faire face à ces attaques adverses. PyRAT est un outil de vérification formelle de réseau de neurones qui se base sur l’interprétation abstraite et permet d’apporter des garanties mathématiques fortes de sécurité sur un modèle IA. De son côté, PARTICUL permet de construire des détecteurs de parties récurrentes dans un ensemble de données pour les associer à une mesure de confiance sur leur présence ou non dans les entrées d’un modèle. Leur utilisation et combinaison durant la phase de validation et de monitoring d’un système IA permet de se prémunir et de détecter durant l’utilisation les attaques adverses.

Ses atouts

Un large éventail de détection

  • L’approche proposée combine une approche formelle de vérification de sécurité avec PyRAT et une approche plus empirique avec PARTICUL mais à plus large spectre de détection. Ces approches complémentaires permettent un large éventail de détection d’attaques. PyRAT permet une analyse plus forte sur des perturbations bornées et invisible à l’œil nu tandis que PARTICUL devrait être plus performant sur des attaques visibles dans ses détecteurs de parties.
  • Agissant dès la fin de la phase d’entrainement en plus de la phase de monitoring. PyRAT et PARTICUL peuvent donc s’utiliser à différentes étapes du cycle de vie d’une IA. Ils fournissent ainsi durant tout ce cycle des indicateurs sur la vulnérabilité de l’IA qui peuvent également servir à un ré-entrainement du modèle.

PyRAT et PARTICUL pour la détection d’attaques adverses (différentes étapes)

Applications

Évaluation et monitoring d’IA
  • Détection d’attaque au runtime pour des tâches de classification d’images par de l’IA

Publications

  • Neural Network Verification with PyRAT. Augustin Lemesle, Julien Lehmann, Tristan Le Gall. https://arxiv.org/abs/2410.23903
  • Contextualised Out-of-Distribution Detection using Pattern Identication. Romain Xu-Darme, Julien Girard-Satabin, Darryl Hond, Gabriele Incorvaia, Zakaria Chihani. https://arxiv.org/abs/2311.12855
  • PARTICUL: Part Identification with Confidence measure using Unsupervised Learning. Romain Xu-Darme, Georges Quénot, Zakaria Chihani, Marie-Christine Rousset. https://arxiv.org/abs/2206.13304

À lire également

Domaines applicatifs

Cybersécurité : garantir la sécurité et la confidentialité par conception

Au cœur des enjeux de souveraineté numérique, la cybersécurité constitue aujourd’hui un pan essentiel de nos sociétés. Garante de l’autonomie et de la paix dans le cyberespace, elle est un ...
Lire la suite
Plateformes technologiques

Cybersécurité

Identifier les vulnérabilités de systèmes matériels et logiciels et développer des techniques de protection expertes.
Lire la suite
Rapport activité 2024

Succès de PyRAT dans une compétition de vérification formelle

Dans un contexte où fiabiliser les systèmes contenant des intelligences artificielles est devenu un enjeu majeur de sécurité, nos équipes ont conçu PyRAT, un outil de vérification formelle de r...
Lire la suite