Stage - Benchmark des pics de consommation de serveur à base de CPU et GPU R&D (H/F)
Les Clayes-sous-Bois, FR
Eviden, qui fait partie du groupe Atos, avec un chiffre d'affaires annuel d'environ 5 milliards d'euros, est un leader mondial de la transformation numérique axée sur les données, fiable et durable. En tant qu'entreprise numérique de nouvelle génération, avec des positions de leader mondial dans les domaines du numérique, du cloud, des données, de l'informatique avancée et de la sécurité, elle apporte une expertise approfondie à tous les secteurs d'activité dans plus de 47 pays. En réunissant des technologies haut de gamme uniques sur l'ensemble du continuum numérique et 47 000 talents de classe mondiale, Eviden élargit les possibilités des données et de la technologie, aujourd'hui et pour les générations à venir.
Notre centre recherche et développement, basée au Clayes-sous-Bois conçoit, développe et valide des serveurs de calculs intensifs HPC (High Performance Computing ) Ces serveurs qui utilisent les innovations d’Eviden ou de ses partenaires Intel, AMD, Nvidia, ARM, Samsung, Micron, Broadcom … sont parmi les plus puissants au monde, a refroidissement liquide, consommant prochainement jusqu’à 250kW par armoire, avec un régulateur de tension multi-phase > 500A pour CPU/GPU.
L’équipe a par exemple développé des supercalculateurs livrés par Eviden et présents dans le classement mondiale Top500 de supercalculateur les plus puissants ( https //www.top500.org/lists/top500/2023/11/ ), dont le système Leonardo en Italie classé septième mondial, ou le système MareNostrum classé 8eme mondial avec CPU Intel Sapphire Rapids avec mémoire DDR5 relié par PCIe gen5 à des GPU Nvidia H100. L’équipe développe le 1er système Exascale Européen Jupiter (https://www.fz-juelich.de/en/ias/jsc/jupiter/tech) basée sur l’architecture BullSequana XH3000 refroidie par liquide d’Eviden avec près de 24 000 superpuces NVIDIA GH200 interconnectées par des liens 400Gb NDR InfiniBand. Les premiers serveurs livrées sont classé n°1 au Green500. En 10 ans, nous sommes passé de CPU consommant 150W a des futurs GPU consommant 1500W soit un facteur 10 alors que le volume prévu pour les alimentations et distribution de puissance n’a augmenté que d’un facteur 2. En parallèle, les fabricants de processeur et GPU ont ajouté des nouvelles fonctions de gestion power , amélioré les modes turbo qui font qu’en plus de la puissance nominal élevée, les processeurs peuvent générer des pics de puissance jusqu’à plus de 200% pendant des courtes durées ce qui complexifie la distribution de puissance et limite le nombre maximum de serveur rack.
Dans ce contexte, nous recherchons un stagiaire de fin d’études en électronique (école d’ingénieur ou Master 2) pour un stage rémunéré et certifié "Happy Trainees".
Il se déroulera sur 6 mois dans les locaux de la R&D aux Clayes-sous-Bois, dans un environnement équipé de machines de pointe.
L’objectif du stage est d’améliorer notre compréhension du profile d’alimentation en temp réel en fonction des stress et de trouver les paramètres permettant d’influencer ces profiles. Le stage portera sur les 4 axes suivants :
• Mettre en place une procédure de test pour réaliser des mesures de pics de consommation des lames de calcul. Ces pics sont liés à l’utilisation de logiciel de calcul intensif réaliser sur les lames pour de la simulation météo, nucléaire, réseau neuronal... Que ce soit du côté de l’entrée d’alimentation 54V du rack ou de l’alimentation 12V des carte mère. Pour des plateformes à base de CPU et de GPU AMD (mais aussi pour Intel, Nvidia).
• Définir les logiciels de bench, des scripts bas niveau ou d’autres solutions… pour réaliser les tests de pic sur plateforme CPU et GPU. Utilisation de linux sur des cartes mères CPU, GPU et APU (accelerator processor unit => mix de CPU et GPU)
• Rédiger une note d’application qui permet de vérifier le dimensionnement électrique du rack selon la procédure de test qui aura été définit.
• Rechercher des solutions techniques qui pourrais diminuer ou mettre sous contrôle les pics sans dégrader la performance de calcul des lames.
Profil recherché :
- Etudiant en dernière année d’école d’ingénieur ou Master2 en électronique en système embarqué. Passionné d’électronique avec une appétence pour linux et les outils informatiques. Besoin d’utiliser du matériel de mesures électroniques. - Curiosité, facilité de communication (en français et en anglais) : ce stage nécessite d'échanger avec différentes personnes de différents métiers et différentes nationalités
Let’s grow together.