Partager

PIXANO simplifie l’annotation d’images pour la vision par ordinateur

PIXANO est une solution open source pour l’annotation web à grand échelle d’images et de vidéos pour les applications de vision par ordinateur. PIXANO assiste l’humain dans ses tâches d’étiquetage des images par une annotation semi-automatique.

L’usage

L’annotation intelligente de données visuelles

La vision par ordinateur est une des applications emblématiques de l’IA. Elle consiste à rendre la machine capable de reconnaître automatiquement des objets dans des images réelles ou de synthèse et des vidéos. La plupart des méthodes de perception utilisées requiert d’annoter préalablement une quantité importante d’images qui vont servir d’exemples lors de la phase d’apprentissage par la machine.

PIXANO (Pixel Annotation) est une solution open source pour faciliter l’annotation web à grand échelle d’images et de vidéos. Elle consiste en un ensemble d’outils logiciels et d’algorithmes de vision par ordinateur et d’apprentissage automatique qui assistent l’humain dans sa tâche de création et d’apposition d’étiquettes pour la rendre plus efficace.

Parmi les fonctionnalités principales de l’outil :

  • la pré-annotation automatique des images ;
  • l’annotation assistée et interactive, pour permettre à l’utilisateur d’intervenir et de corriger en ligne des étiquettes ;
  • la propagation temporelle automatique des labels, pour l’annotation des séquences vidéos ;
  • l’apprentissage actif et incrémental, par l’ajout successif de nouvelles données sélectionnées par un algorithme.

PIXANO comprend également des outils d’analyse de données très puissants permettant de chercher et sélectionner très rapidement dans une base d’images annotées les données les plus pertinentes pour un besoin particulier.

L’efficacité de PIXANO a été validée par des acteurs majeurs de l’industrie, notamment automobile, dans le cadre de partenariats avec le CEA-List et dans des projets collaboratifs comme le projet européen H2020 CloudLSVA.

Par sa modularité et sa capacité à intégrer de nouveaux composants personnalisables et intelligents, PIXANO ouvre de larges perspectives de création de solutions adaptées aux besoins des concepteurs d’IA.

Découvrir PIXANO

Ouverture et performance

Ses principales forces :

  • sa large gamme de formats d’étiquette (boîte englobante, polygone, cuboïde, points d’intérêt, masque pixellique, etc.) ;
  • ses fonctions de data mining, pour constituer des bases annotées d’apprentissage et d’évaluation à partir d’ensemble d’images plus large ; cela, grâce à des critères d’exploration évolués (reposant sur des informations sémantiques ou sur une caractérisation de la pertinence du contenu visuel par rapport à une tâche de vision donnée, par exemple) ;
  • son ouverture et son évolutivité : la solution est constituée d’un ensemble de composants open source ouverts, réutilisables, personnalisables, extensibles.

Solutions de perception et gestion de données

  • Génération de bases de données labellisées pour le développement de solutions de perception (industrie, sécurité, robotique, transports…)
  • Développement d’outils d’annotation semi-automatiques, pour étiqueter des images visuelles 2D/3D
  • Développement de nouveaux outils de gestion de la donnée (exploration de méthodes de data mining, caractérisation de datasets, génération d’images de synthèse…)
Cas d'usage

Le véhicule autonome

L’annotation automatique à grande échelle de données issues de caméras et de Lidar pour la perception du véhicule autonome.

Pixano | Smart annotation

Publications

UCP-Net: Unstructured Contour Points for Instance Segmentation, C. Dupont, Y. Ouakrim, Q. C. Pham, IEEE International Conference on Systems, Man, and Cybernetics (SMC), 202.

Classifying All Interacting Pairs in a Single Shot, S. Chafik, A. Orcesi, R. Audigier and B. Luvison. IEEE Winter Conference on Applications of Computer Vision (WACV), 2020.

PandaNet: Anchor-Based Single-Shot Multi-Person 3D Pose Estimation, A. Benzine, F. Chabot, B. Luvison, Q. C. Pham, C. Achard, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2020.

Deep MANTA: A Coarse-to-Fine Many-Task Network for Joint 2D and 3D Vehicle Analysis from Monocular Image, F. Chabot, M. Chaouch, J. Rabarisoa, C. Teulière and T. Chateau. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2017.

Improving Multi-frame Data Association with Sparse Representations for Robust Near-online Multi-object Tracking, L. Fagot-Bouquet, R. Audigier, R. Dhome, F. Lerasle. European Conference on Computer Vision (ECCV), 2016.

Fast and accurate video annotation using dense motion hypotheses, L. Fagot-Bouquet, J. Rabarisoa, Q.C. Pham. IEEE International Conference on Image Processing (ICIP), 2014.

 

Pour en savoir plus, consulter le site dédié à PIXANO

Accéder à la page PIXANO sur Github.

À lire également

Success Story

Arcure

Arcure et le CEA-List ont développé conjointement une caméra 3D embarquée capable de détecter les piétons à proximité des engins mobiles industriels pour éviter les risques de collision.
Lire la suite