Partager

19 août 2021 | Factory-IA : une plateforme de calcul au service des algorithmes d’Intelligence Artificielle

19 août 2021 | Factory-IA : une plateforme de calcul au service des algorithmes d’Intelligence ArtificielleAu cours de leur processus d’apprentissage, les algorithmes d’intelligence artificielle (IA) sont entraînés sur de grands volumes de données (14 millions d’images dans Imagenet, une référence du domaine). C’est ce qui leur permet d’optimiser leur gigantesque nombre de paramètres (175 milliards de paramètres pour GPT3, l’IA mastodonte d’OpenAI). La puissance de calcul nécessaire à ce processus est donc considérable, mais c’est le prix à payer pour concevoir des IA performantes.

Pour disposer de l’autonomie et de l’agilité nécessaire à nos développements, nous nous sommes dotés dès 2019 d’une infrastructure de calcul dédiée à l’intelligence artificielle, Factory-IA. Hébergée au TGCC (très grand centre de calcul du CEA) à Bruyères-le-Chatel, cette plateforme a bénéficié du soutien de la région Île-de-France (Sésame). Le calculateur, péta-flopique (soit un million de milliards d’opérations par seconde) compte une trentaine de nœuds de calcul, et plus de 200 cartes GPU, dont une partie de toute dernière génération.

Les technologies du calcul intensif (HPC) évoluant rapidement (CPU/GPU, interconnexion et mémoire associée), nous avons noué à cette occasion des contacts étroits avec trois grands acteurs du domaine : Intel, AMD et NVIDIA. Cette proximité nous offre à la fois une meilleure visibilité sur leurs développements en cours et un accès privilégié à leurs équipements de dernière génération (AMD et GPU A100 de NVidia) pour éprouver nos algorithmes.

Depuis sa mise en service, la plateforme a été très sollicitée par ses utilisateurs : agents CEA, stagiaires ou doctorants, avec, fin 2020, déjà plus de 110 comptes, et plus de 73 000 jobs lancés, occupant 130 To d’espace disque. Pour les seules équipes du CEA-List, plus d’une douzaine de publications scientifiques ont directement bénéficié de la plateforme Factory-AI : I3E/CVF 2020 (Conference on Computer Vision), I3E/WACV 2020 (Winter Conference on Applications of Computer Vision), ICPR 2020 (International Conference on Pattern Recognition), etc.

Florence Carton, doctorante au CEA-List sur le renforcement learning visant à construire une IA, capable d’apprendre par elle-même à piloter un véhicule, précisait lors de sa soutenance (31 mai) : « Pendant ma thèse j’ai effectué sur Factory-AI l’équivalent de 39 ans de calcul sur un PC standard. »

L’infrastructure est quotidiennement exploitée pour les besoins de R&D avec nos partenaires industriels :

  • IA pour la perception de l’environnement autour du véhicule avec Valeo ;
  • système de protection des personnes au voisinage d’engins de travaux publics, basé sur des modèles de détection et de localisation 3D de personnes par vision avec Arcure ;
  • modèles d’analyse de comportements de bovins pour la prévention des pathologies avec AIHerd ;
  • technologies de contrôle industriel avec Veolia, Technip Energy, Limagrain ;
  • construction d’un modèle d’analyse textuelle permettant la synthèse automatique de rapport médicaux.

 

Et en lien avec nos partenaires académiques et institutionnels :

  • systèmes d’analyses vidéo pour le sport de haut niveau (gestuelle et comportement collectif) ;
  • application grand public de sensibilisation au contrôle des données personnelles sur les réseaux sociaux (https://ydsyo.app/).

 

Un investissement complémentaire de 750k€ est en cours pour encore accroître les capacités de calcul de Factory-IA.

 

En savoir plus : https://www.universite-paris-saclay.fr/plateforme-saclay-ia