Analyse de scène 3D à partir de requêtes en langage naturel

Rapport scientifique 2025 • avril 1, 2026

MiRAG : génération augmentée de récupération multi-niveau pour répondre à des questions visuelles

Le CEA-List a développé le modèle MiRAG pour la tâche de réponse à des questions visuelles à propos d’entités nommées, en y appliquant pour la première fois une approche d’intelligence artificielle générative fondée sur la génération augmentée de récupération (RAG).

Rapport scientifique 2025 • avril 1, 2026

Découvrir le monde sans annotations avec xMOD : collaboration entre vision 2D et 3D

Découvrir et localiser des objets en 3D sans aucune annotation humaine est un défi majeur en vision par ordinateur. xMOD, développé par le CEA-List, est une méthode innovante de distillation croisée qui fait collaborer caméras (2D) et capteurs LiDAR (3D).

Rapport scientifique 2025 • avril 1, 2026

Analyse de scène 3D à partir de requêtes en langage naturel

Développée par le CEA-List, la méthode de segmentation sémantique DISCO-3D permet de découvrir, dans une scène 3D, les éléments correspondant à des sous-concepts sémantiques d’une requête utilisateur exprimée en langage naturel.

nlp

MiRAG : génération augmentée de récupération multi-niveau pour répondre à des questions visuelles

Découvrir le monde sans annotations avec xMOD : collaboration entre vision 2D et 3D

Analyse de scène 3D à partir de requêtes en langage naturel

Le CEA-List, spécialiste des systèmes numériques intelligents

▼ Naviguer dans le portail ▼