Sécurité des IA face aux attaques adverses

#cybersécurité #IA #PARTICUL #PyRAT

Les systèmes à base d’intelligence artificielle (IA) sont vulnérables à des menaces tout au long de leur cycle de développement. Les outils PyRAT et PARTICUL développés par le CEA-List permettent de détecter et de se prémunir contre les attaques adverses.

L'usage

Détection d’attaques adverses avec PyRAT et PARTICUL

Les récentes avancées en matière d’intelligence artificielle ont permis une rapide popularisation des systèmes à base d’IA qui font désormais partie de notre vie quotidienne et sont présents dans de nombreux domaines industriels. Comme tout système informatique, les systèmes à base d’IA sont vulnérables à de nombreuses menaces durant tout leur cycle de développement, de la collecte de données en passant par l’entraînement jusqu’à leur déploiement. Dès 2014 leur fragilité face à des attaques adverses a été démontrée, des perturbations ajoutées à l’image permettent d’altérer la décision d’une IA tout en restant imperceptible à l’œil nu. De manière similaire, des attaques dites par patch permettent par un simple sticker positionné à côté d’un objet d’en altérer sa reconnaissance par une IA.

Le CEA-List propose une solution combinant les outils PyRAT et PARTICUL pour faire face à ces attaques adverses. PyRAT est un outil de vérification formelle de réseau de neurones qui se base sur l’interprétation abstraite et permet d’apporter des garanties mathématiques fortes de sécurité sur un modèle IA. De son côté, PARTICUL permet de construire des détecteurs de parties récurrentes dans un ensemble de données pour les associer à une mesure de confiance sur leur présence ou non dans les entrées d’un modèle. Leur utilisation et combinaison durant la phase de validation et de monitoring d’un système IA permet de se prémunir et de détecter durant l’utilisation les attaques adverses.

Ses atouts

Un large éventail de détection

L’approche proposée combine une approche formelle de vérification de sécurité avec PyRAT et une approche plus empirique avec PARTICUL mais à plus large spectre de détection. Ces approches complémentaires permettent un large éventail de détection d’attaques. PyRAT permet une analyse plus forte sur des perturbations bornées et invisible à l’œil nu tandis que PARTICUL devrait être plus performant sur des attaques visibles dans ses détecteurs de parties.
Agissant dès la fin de la phase d’entrainement en plus de la phase de monitoring. PyRAT et PARTICUL peuvent donc s’utiliser à différentes étapes du cycle de vie d’une IA. Ils fournissent ainsi durant tout ce cycle des indicateurs sur la vulnérabilité de l’IA qui peuvent également servir à un ré-entrainement du modèle.

PyRAT et PARTICUL pour la détection d’attaques adverses (différentes étapes)

Applications

Évaluation et monitoring d’IA

Détection d’attaque au runtime pour des tâches de classification d’images par de l’IA

Publications

Neural Network Verification with PyRAT. Augustin Lemesle, Julien Lehmann, Tristan Le Gall. https://arxiv.org/abs/2410.23903
Contextualised Out-of-Distribution Detection using Pattern Identication. Romain Xu-Darme, Julien Girard-Satabin, Darryl Hond, Gabriele Incorvaia, Zakaria Chihani. https://arxiv.org/abs/2311.12855
PARTICUL: Part Identification with Confidence measure using Unsupervised Learning. Romain Xu-Darme, Georges Quénot, Zakaria Chihani, Marie-Christine Rousset. https://arxiv.org/abs/2206.13304

Sécurité des IA face aux attaques adverses

Détection d’attaques adverses avec PyRAT et PARTICUL

Un large éventail de détection

PyRAT et PARTICUL pour la détection d’attaques adverses (différentes étapes)

Applications

Évaluation et monitoring d’IA

Publications

À lire également

Cybersécurité : garantir la sécurité et la confidentialité par conception

Cybersécurité

Succès de PyRAT dans une compétition de vérification formelle

Le CEA-List, spécialiste des systèmes numériques intelligents

▼ Naviguer dans le portail ▼