Partager

Démonstration d’IA générative appliquée à la saisie robotique

Notre démonstrateur de robotique intelligente illustre le potentiel des approches d’IA générative pour réaliser une tâche robotique spécifiée en langage naturel. Nos équipes ont conçu un agent de manipulation robotique basé sur la vision artificielle et l’apprentissage profond, capable de réagir avec précision à une instruction de haut niveau en langage naturel correspondant à une tâche de saisie.

 

L’objectif de nos recherches est de concevoir une brique logicielle permettant à un robot de comprendre et d’exécuter des tâches spécifiées en langage naturel (ou indiquées par des images), transformant ainsi des interactions intuitives en actions physiques concrètes.

Nous avons intégré un modèle d’IA générique, ou modèle de fondation, basé sur une architecture Transformer pré-entraînée sur un large ensemble de trajectoires de robots. Ce modèle est ensuite affiné sur nos propres données afin d’optimiser ses performances pour nos applications spécifiques.
Le modèle sélectionné, Octo[1], est conçu pour s’adapter efficacement à diverses configurations robotiques tout en nécessitant un volume de données limité et des ressources de calcul modérées. Cette flexibilité repose sur sa structure modulaire d’attention, qui facilite son ajustement aux spécificités des tâches ciblées, améliorant la généralisation et les performances du modèle sur un large éventail d’applications robotiques.

Pour collecter des données spécifiques à notre problématique de saisie robotique, nous avons mis en place une fonctionnalité de télé-opération. Elle repose sur une plateforme robotique incluant un robot léger à 6 axes, contrôlé à distance par une manette de réalité virtuelle. Cette méthode de contrôle permet une manipulation précise et intuitive, essentielle à l’acquisition de données de bonne qualité. Pour produire ces données, plusieurs volontaires ont réalisé des saisies robotiques, parmi une dizaine d’objets différents, manipulés dans quatre configurations spatiales distinctes.

 

Séance d’acquisition de données © CEA

 

Cette diversité est cruciale pour assurer la diversité et la représentativité des données recueillies, permettant au robot de traiter une grande variété de scénarios de manipulation. Enfin, pour corriger d’éventuelles erreurs d’annotation, une étape essentielle de nettoyage des données acquises a été menée à l’aide du logiciel PIXANO, développé au CEA-List. Les données nettoyées ont été utilisées pour fine-tuner le modèle Octo. Ces données de laboratoire correspondent à un jeu de données d’entraînement de 678 trajectoires et un jeu de test de 70 trajectoires. Finalement, cet entraînement a abouti à la démonstration de la capacité du système à identifier et saisir un objet de la base d’apprentissage placé seul, ou au milieu de distracteurs, sans perception 3D dédiée. Les travaux se poursuivent et visent maintenant à réaliser des tâches plus complexes parmi lesquelles des saisies d’objet bimanuelles.

 

[1] Octo Model Team, D. Ghos, H. R. Walke, K. Pertsch, K. Black, O. Mees, S. Dasari, J. Hejna, T. Kreiman, C. Xu, J. Luo, Y. L. Tan, P. R. Sanketi, Q . Vuong, T. Xiao, D. Sadigh, C. Finn and S. Levine, Octo: An Open-Source Generalist Robot Policy, ArXiv, 2024, https://api.semanticscholar.org/CorpusID:266379116

 


Saisie d’un objet-cible parmi des distracteurs. © CEA

Ces développements s’inscrivent dans nos travaux sur la programmation intuitive, visant à rendre la robotique accessible aux opérateurs non experts.

Rebecca Cabean

Caroline Vienne

Adjointe au chef de service — CEA-List

Nos travaux visent à développer des systèmes robotiques robustes, accessibles et rapides à déployer, à destination de l’industrie, grâce à l’intelligence artificielle.

Rebecca Cabean

Jaonary Rabarisoa

Ingénieur-chercheur — CEA-List

Ont contribué à l’écriture de cet article :

  • Caroline Vienne, adjointe au chef de service au CEA-List
  • Jaonary Rabarisoa, ingénieur-chercheur au CEA-List

À lire également

Avancées technologiques

11 juillet 2024 | Robotique d’assistance aux operateurs pour la manipulation précise de charges lourdes

Cobomanip, un système cobotique made in CEA-List, assure une assistance physique aux opérateurs lors de la manipulation très précise de charges importantes dans des environnements complexes.
Lire la suite
Enjeux

Intelligence artificielle

Les technologies d’intelligence artificielle se sont glissées dans tous les interstices de nos vies, privées comme professionnelles. Elles transforment nos activités, nos relations avec les autre...
Lire la suite
Plateformes technologiques

Robotique interactive SMART

La plateforme Robotique interactive SMART accueille les développements du CEA-List et de ses partenaires industriels sur les cobots, exosquelettes et autres robots collaboratifs.
Lire la suite