Partager

Pixano facilite le développement d’IA « centrées sur les données » pour la vision par ordinateur

ornamental picture
© Pixano
Pixano, notre outil d’annotation de données pour la vision par ordinateur, s’enrichit de nouvelles fonctionnalités visant à améliorer la qualité des données d’apprentissage. Cela, afin d’optimiser les entraînements et d’accroître les performances des modèles.

Une approche centrée sur les données

Pixano a été conçu pour faciliter l’annotation des données servant à l’entraînement des IA de vision par ordinateur. Il s’étoffe aujourd’hui d’un ensemble de fonctions permettant d’explorer, d’analyser et de générer des données de qualité.

Notre outil suit ainsi les nouvelles méthodes pour le développement de modèles d’IA. Il met l’accent sur la préparation des contenus utilisés pour l’apprentissage avant de chercher à optimiser le modèle lui-même. Cette démarche « centrée sur les données » vise à optimiser les entraînements et accroître les performances du modèle. Elle contribue aussi à générer de la confiance.

 

Des bases d’apprentissage qualifiées

L’outil permet de réaliser des calculs statistiques sur les données afin de les caractériser (calcul du niveau de bruit, par exemple). Des fonctions de visualisation et de filtrage autorisent ensuite la sélection des données destinées à l’apprentissage.

La recherche d’images spécifiques par simple description contextuelle devient également possible grâce à l’appui d’un grand modèle de langage ou LLM (Large Language Model) dans le moteur de recherche sémantique.

 

Une annotation intelligente

Pixano dispose d’un ensemble de fonctions d’annotation automatique d’images, de vidéos et de nuages de points. Il est aussi possible d’utiliser des algorithmes tiers tels que le réseau de neurones profond Segment Anything Model (SAM) qui permet de détourer des objets dans une image en un nombre réduit d’actions.

 

Vers des modèles plus explicables

Enfin, l’outil intègrera prochainement des fonctionnalités d’analyse et d’interprétabilité des modèles qui permettront aux utilisateurs de mieux comprendre et traduire les décisions prises par les modèles d’IA.

Une large couverture des cas d’usage de la vision par ordinateur

Grâce à sa capacité d’annoter non seulement les images, mais aussi les vidéos (mouvements), les nuages de points (2D et 3D) et de mixer différents types de sources, l’outil couvre les trois grandes familles de cas d’usage de vision par ordinateur :

  • l’analyse d’images (médecine, e-commerce, agriculture, imagerie satellitaire, etc.),
  • l’analyse de scènes vidéo (sport, surveillance, média, etc.),
  • la perception de l’environnement en temps réel (conduite autonome, robotique, etc.).

Une refonte en python

L’outil est constitué d’un ensemble de composants en open source, réutilisables, personnalisables et extensibles. Il a été entièrement réécrit en Python, langage privilégié par les data scientists, afin de faciliter son interopérabilité. Une API permet de l’incorporer dans un processus de développement de modèles d’IA et de l’utiliser en interaction avec les frameworks d’apprentissage machine les plus répandus.

Les composants visuels de Pixano sont également utilisables dans un Jupyter Notebook, offrant ainsi des possibilités de personnalisation.

Une réponse au besoin d’IA de confiance

En donnant aux data scientists le moyen de maîtriser leurs données d’apprentissage, de contrôler leur annotation, de répondre à une large gamme d’applications et, bientôt, d’améliorer l’explicabilité de ses modèles, Pixano crée les conditions du développement de systèmes d’IA de confiance, c’est-à-dire interprétables, dépourvus de biais, robustes, documentés et fondés sur des données de qualité.

À ce titre, il répond aux objectifs du programme Confiance.ai auquel contribue le CEA-List et dont la vocation est de rassembler dans une plateforme interopérable l’ensemble des outils favorisant la conception de modèles d’IA de confiance. Les solutions présentes dans la plateforme couvrent les différentes étapes du cycle de développement, depuis l’acquisition des données jusqu’à l’évaluation des performances.

Pixano est un composant de la plateforme Confiance.ai. Il est compatible avec les standards du cloud computing et s’intègre parfaitement dans un processus MLOps.

Pixano est un ensemble d’outils que nous mettons à la disposition de la communauté, en open source, pour permettre aux concepteurs d’IA d’explorer les possibilités les plus avancées de cette discipline.

Jaonary Rabarisoa

Senior Research Scientist, CEA-List —

À lire également

Environnements de développement logiciel

PIXANO

Une solution open source pour l'annotation web à grand échelle d'images et de vidéos.
Lire la suite
Plateformes technologiques

Intelligence artificielle

La plateforme IA Responsable met à disposition des partenaires du CEA-List un ensemble de moyens pour concevoir et valider des intelligences artificielles performantes, de confiance et frugales et po...
Lire la suite
Communiqués de presse

06 octobre 2021 | Programme « Confiance.ai »

Une première version de l’environnement de confiance d’ici la fin de l’année 2021 intégrera plus de 20 composants technologiques ou méthodologiques
Lire la suite