Partager

14 avril 2021 | Streamer simule des flux de données massives

14 avril 2021 | Streamer simule des flux de données massives
© Florence Pillet
Avec Streamer, le CEA List, institut de CEA Tech, propose aux développeurs d’algorithmes de traitement de flux de données, un environnement d’expérimentations basé sur la simulation réaliste des contextes opérationnels. La conception de cette plate-forme a été pensée avec trois objectifs principaux : contrôle, facilité et réactivité.

Réseaux sociaux, IoT… le nombre d’applications générant des quantités importantes de données s’est multiplié cette dernière décennie. Avec elles, le besoin en logiciels de traitements des flux de données, capables d’apprendre en temps réel (stream machine learning) pour en extraire de l’information et de la valeur, devient un enjeu essentiel. Développée par les chercheurs de l’institut Carnot CEA List, Streamer est une plate-forme open source qui s’adresse aux développeurs de logiciels de traitement et d’analyse des flux de données et aux chercheurs concevant des algorithmes pour ces logiciels.

Ces outils doivent en effet être capables de traiter des flux de données continus sans les stocker, et donc de s’adapter et d’apprendre en temps réel. Afin d’évaluer leur efficacité, les développeurs ont besoin de les tester dans des contextes de streaming réalistes. L’objectif de Streamer est justement de leur fournir cet environnement de test en conditions réelles, en simulant un contexte de flux de données (émission et réception) adapté à chaque situation. Des algorithmes de pré-traitement et de post-traitement des données y sont d’ores et déjà intégrés (classification, réseaux de neurones, etc). L’utilisateur peut facilement ajouter de nouveaux algorithmes à partir de codes en R ou en python. Plusieurs métriques d’évaluation des algorithmes sont également intégrées, permettant aux utilisateurs de tester facilement les algorithmes en cours de développement.

Facile et rapide à installer, Streamer peut être déployée sur n’importe quel système d’exploitation (Windows, Linux, MacOS). Elle est dotée d’une interface graphique facilitant la supervision des tests sans avoir à entrer dans le code. Enfin, elle est disponible en open source autour d’une communauté de développeurs qui contribuent en permanence à son évolution et mise à jour.

 

Retrouvez cette actualité sur http://www.cea-tech.fr/