PIXANO est une solution open source pour l’annotation web à grand échelle d’images et de vidéos pour les applications de vision par ordinateur. PIXANO assiste l’humain dans ses tâches d’étiquetage des images par une annotation semi-automatique.
La vision par ordinateur est une des applications emblématiques de l’IA. Elle consiste à rendre la machine capable de reconnaître automatiquement des objets dans des images réelles ou de synthèse et des vidéos. La plupart des méthodes de perception utilisées requiert d’annoter préalablement une quantité importante d’images qui vont servir d’exemples lors de la phase d’apprentissage par la machine.
PIXANO (Pixel Annotation) est une solution open source pour faciliter l’annotation web à grand échelle d’images et de vidéos. Elle consiste en un ensemble d’outils logiciels et d’algorithmes de vision par ordinateur et d’apprentissage automatique qui assistent l’humain dans sa tâche de création et d’apposition d’étiquettes pour la rendre plus efficace.
Parmi les fonctionnalités principales de l’outil :
PIXANO comprend également des outils d’analyse de données très puissants permettant de chercher et sélectionner très rapidement dans une base d’images annotées les données les plus pertinentes pour un besoin particulier.
L’efficacité de PIXANO a été validée par des acteurs majeurs de l’industrie, notamment automobile, dans le cadre de partenariats avec le CEA-List et dans des projets collaboratifs comme le projet européen H2020 CloudLSVA.
Par sa modularité et sa capacité à intégrer de nouveaux composants personnalisables et intelligents, PIXANO ouvre de larges perspectives de création de solutions adaptées aux besoins des concepteurs d’IA.
Ses principales forces :
UCP-Net: Unstructured Contour Points for Instance Segmentation, C. Dupont, Y. Ouakrim, Q. C. Pham, IEEE International Conference on Systems, Man, and Cybernetics (SMC), 202.
Classifying All Interacting Pairs in a Single Shot, S. Chafik, A. Orcesi, R. Audigier and B. Luvison. IEEE Winter Conference on Applications of Computer Vision (WACV), 2020.
PandaNet: Anchor-Based Single-Shot Multi-Person 3D Pose Estimation, A. Benzine, F. Chabot, B. Luvison, Q. C. Pham, C. Achard, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2020.
Deep MANTA: A Coarse-to-Fine Many-Task Network for Joint 2D and 3D Vehicle Analysis from Monocular Image, F. Chabot, M. Chaouch, J. Rabarisoa, C. Teulière and T. Chateau. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2017.
Improving Multi-frame Data Association with Sparse Representations for Robust Near-online Multi-object Tracking, L. Fagot-Bouquet, R. Audigier, R. Dhome, F. Lerasle. European Conference on Computer Vision (ECCV), 2016.
Fast and accurate video annotation using dense motion hypotheses, L. Fagot-Bouquet, J. Rabarisoa, Q.C. Pham. IEEE International Conference on Image Processing (ICIP), 2014.
Pour en savoir plus, consulter le site dédié à PIXANO
Accéder à la page PIXANO sur Github.