Pixano a été conçu pour faciliter l’annotation des données servant à l’entraînement des IA de vision par ordinateur. Il s’étoffe aujourd’hui d’un ensemble de fonctions permettant d’explorer, d’analyser et de générer des données de qualité.
Notre outil suit ainsi les nouvelles méthodes pour le développement de modèles d’IA. Il met l’accent sur la préparation des contenus utilisés pour l’apprentissage avant de chercher à optimiser le modèle lui-même. Cette démarche « centrée sur les données » vise à optimiser les entraînements et accroître les performances du modèle. Elle contribue aussi à générer de la confiance.
L’outil permet de réaliser des calculs statistiques sur les données afin de les caractériser (calcul du niveau de bruit, par exemple). Des fonctions de visualisation et de filtrage autorisent ensuite la sélection des données destinées à l’apprentissage.
La recherche d’images spécifiques par simple description contextuelle devient également possible grâce à l’appui d’un grand modèle de langage ou LLM (Large Language Model) dans le moteur de recherche sémantique.
Pixano dispose d’un ensemble de fonctions d’annotation automatique d’images, de vidéos et de nuages de points. Il est aussi possible d’utiliser des algorithmes tiers tels que le réseau de neurones profond Segment Anything Model (SAM) qui permet de détourer des objets dans une image en un nombre réduit d’actions.
Enfin, l’outil intègrera prochainement des fonctionnalités d’analyse et d’interprétabilité des modèles qui permettront aux utilisateurs de mieux comprendre et traduire les décisions prises par les modèles d’IA.
Grâce à sa capacité d’annoter non seulement les images, mais aussi les vidéos (mouvements), les nuages de points (2D et 3D) et de mixer différents types de sources, l’outil couvre les trois grandes familles de cas d’usage de vision par ordinateur :
L’outil est constitué d’un ensemble de composants en open source, réutilisables, personnalisables et extensibles. Il a été entièrement réécrit en Python, langage privilégié par les data scientists, afin de faciliter son interopérabilité. Une API permet de l’incorporer dans un processus de développement de modèles d’IA et de l’utiliser en interaction avec les frameworks d’apprentissage machine les plus répandus.
Les composants visuels de Pixano sont également utilisables dans un Jupyter Notebook, offrant ainsi des possibilités de personnalisation.
En donnant aux data scientists le moyen de maîtriser leurs données d’apprentissage, de contrôler leur annotation, de répondre à une large gamme d’applications et, bientôt, d’améliorer l’explicabilité de ses modèles, Pixano crée les conditions du développement de systèmes d’IA de confiance, c’est-à-dire interprétables, dépourvus de biais, robustes, documentés et fondés sur des données de qualité.
À ce titre, il répond aux objectifs du programme Confiance.ai auquel contribue le CEA-List et dont la vocation est de rassembler dans une plateforme interopérable l’ensemble des outils favorisant la conception de modèles d’IA de confiance. Les solutions présentes dans la plateforme couvrent les différentes étapes du cycle de développement, depuis l’acquisition des données jusqu’à l’évaluation des performances.
Pixano est un composant de la plateforme Confiance.ai. Il est compatible avec les standards du cloud computing et s’intègre parfaitement dans un processus MLOps.
Pixano est un ensemble d’outils que nous mettons à la disposition de la communauté, en open source, pour permettre aux concepteurs d’IA d’explorer les possibilités les plus avancées de cette discipline.