Stage - Développement en RUST d'un plugin Alumet, outil de collecte de métriques bas-niveau R&D
Echirolles, FR
Eviden, qui fait partie du groupe Atos, avec un chiffre d'affaires annuel d'environ 5 milliards d'euros, est un leader mondial de la transformation numérique axée sur les données, fiable et durable. En tant qu'entreprise numérique de nouvelle génération, avec des positions de leader mondial dans les domaines du numérique, du cloud, des données, de l'informatique avancée et de la sécurité, elle apporte une expertise approfondie à tous les secteurs d'activité dans plus de 47 pays. En réunissant des technologies haut de gamme uniques sur l'ensemble du continuum numérique et 47 000 talents de classe mondiale, Eviden élargit les possibilités des données et de la technologie, aujourd'hui et pour les générations à venir.
Au sein de la R&D d’Eviden, l’équipe SEED (Software for Energy Efficiency and Decarbonization) conçoit des solutions logicielles pour la mesure et la réduction de l’empreinte carbone du numérique. Son savoir-faire est centré autour de quatre piliers : Les systèmes distribués (HPC, Edge Computing), la mesure carbone L’intelligence artificielle, les micro-services.
Nous travaillons en collaboration avec l’équipe Datamove du LIG sur le projet ALUMET : Adaptive, Lightweight, Unified Metrics).
L'objectif d'Alumet est d'unifier la collecte de métriques logicielles et matérielles, en particulier la consommation d'énergie, avec une fréquence d'acquisition élevée et une surcharge minimale.
Un tel outil peut être utilisé dans de nombreuses applications : Surveillance HPC, évaluation des émissions de CO2 des travaux, évaluation de l'efficacité énergétique des modèles d'intelligence artificielle... Alumet est conçu pour être extensible à l'aide d’une architecture sous forme de plugins. L’outil est développé en Rust.
Dans ce contexte, nous recherchons un stagiaire motivé par les enjeux climatiques pour développer un plugin Alumet afin de collecter les données GPU (nvidia) dans les cgroups et d’allouer ces ressources aux applications les utilisant. Une implémentation pour collecter les métriques avec le protocole PLDM pourra aussi être étudiée.
Vos missions
Le but de ce stage est de pour développer un plugin Alumet, afin de collecter des données GPU de manière performante.
Le stage se déroulera en 4 étapes :
- Prise en main du pipeline Alumet et du concept des plugins.
- Analyse du système de collecte GPU et définition de l’architecture du plugin.
- Développement plugin et tests unitaires.
- Intégration et validation sur plateforme interne à l’équipe SEED.
Le cadre de développement sera conforme aux exigences de qualité scientifique et technique : bibliographie, détail des hypothèses de travail et des approximations, test unitaires, documentation du code et intégration continue.
Votre profil:
BAC+5 en informatique.
Solides compétences en programmation (La connaissance de Rust est un plus).
Pratique des tests unitaires et de l’intégration continue.
Affinité pour les problématiques de développement durable.
Excellentes compétences de communication/documentation et désir de travailler en équipe dans un environnement dynamique (méthode Scrum/Agile).
Analytique, créatif et aimant résoudre des problèmes.
Let’s grow together.