En intelligence artificielle, la plupart des calculs sont effectués dans le Cloud, loin du lieu de collecte des données. Or le rapprochement entre capacités de calcul et données permet de réduire la consommation d’énergie et le temps de réponse en gardant la confidentialité des données collectées. La réalisation d’une telle intégration nécessite d’associer des accélérateurs d’IA à haute efficacité énergétique et des nœuds IoT flexibles et basse consommation.
C’est ce que propose le CEA avec son circuit SamurAI, constitué d’un nœud IoT basse consommation et d’un accélérateur d’apprentissage machine à haute efficacité énergétique. Doté de deux modes de fonctionnement, ce circuit vise une large gamme d’applications et fonctionne avec une efficacité énergétique optimale.
En mode basse consommation, un contrôleur asynchrone piloté par événements s’active en 207 ns et réalise des tâches de calcul courtes et ponctuelles à 1,7 MOPS. En mode haute performance, un cœur de calcul basse consommation RISC-V couplé à un accélérateur ML à 64 processeurs réalise les tâches de classification les plus exigeantes. Elles peuvent s’exécuter à des puissances allant jusqu’à 36 GOPS et 1,3 TOPS/W lors de l’exécution des tâches de classification. Preuve de la polyvalence de cette architecture combinant logique asynchrone et accélérateur dédié : la consommation en mode veille est 15 000 fois plus faible qu’en utilisation à pleine puissance.
Le circuit SamurAI, réalisé en technologie STMicroelectronics 28 nm est doté d’une radio de réveil, destinée à réveiller le nœud en recevant de courts messages, d’un accélérateur cryptographique pour sécuriser les communications, d’une mémoire externe non volatile pour les états de veille prolongée, et d’une gestion de puissance à modulation de tension adaptative pour réduire la consommation globale. Par rapport à des nœuds IoT similaires, il affiche des performances de calcul 4 fois supérieures, une efficacité énergétique 3,5 supérieure et une consommation divisée par 2.
Le circuit a été testé sur un scénario de comptage de personnes et de classification de scènes. La consommation de l’ensemble du système (caméra vidéo, capteur et module radio) a été divisée par 3 en architecture bi-mode, et par 2,3 quand l’accélérateur ML remplace le cœur RISC-V. La confidentialité des données collectées est préservée.
En savoir plus :
SamurAI: A 1.7MOPS-36GOPS Adaptive Versatile IoT Node with 15,000x Peak-to-Idle Power Reduction, 207ns Wake-up Time and 1.3TOPS/W ML Efficiency