Stage : créer un outil de profilage pour une bibliothèque réseau MPI-aware R&D (H/F)

Publication Date:  Oct 9, 2024
Ref. No:  522085
Location: 

Échirolles, FR, 38130

Eviden, qui fait partie du groupe Atos, avec un chiffre d'affaires annuel d'environ 5 milliards d'euros, est un leader mondial de la transformation numérique axée sur les données, fiable et durable. En tant qu'entreprise numérique de nouvelle génération, avec des positions de leader mondial dans les domaines du numérique, du cloud, des données, de l'informatique avancée et de la sécurité, elle apporte une expertise approfondie à tous les secteurs d'activité dans plus de 47 pays. En réunissant des technologies haut de gamme uniques sur l'ensemble du continuum numérique et 47 000 talents de classe mondiale, Eviden élargit les possibilités des données et de la technologie, aujourd'hui et pour les générations à venir.

 

Profil : Ingénieur logiciel HPC

Contexte et missions : La R&D HPC Software travaille au développement de logiciels pour optimiser le fonctionnement et monitoring des supercalculateurs. Au sein de la R&D, l’équipe DRIM effectue des travaux de recherche et de développement qui consistent à proposer des améliorations des environnements d'exécution HPC, tel que MPI et OpenMP.

 

Elle travaille notamment à l’optimisation de la communication entre les nœuds des supercalculateurs.

Dans ce cadre, l’équipe développe et optimise la bibliothèque de communication Open MPI, implémentant le standard MPI.

Cette couche logicielle est d’une importance clé pour utiliser efficacement les réseaux rapides qui composent les supercalculateurs modernes. En effet, l’équipe a développé une bibliothèque de communication (UBCL) qui pilote le réseau propriétaire. Open MPI appelle la bibliothèque UBCL sur nos supercalculateurs lorsque nous cherchons à faire des communications point-à-points, unilatérales et des collectives.

 

Afin de développer un outil de profilage sur UBCL que nous pourrons activer et désactiver à volonté, nous recherchons un stagiaire de niveau Bac+5. L’objectif du stage est de rendre cet outil capable de donner des indications de performances sur la bibliothèque et ainsi avoir des données pour affiner le paramétrage de la bibliothèque UBCL. Ce travail d’implémentation et d’expérimentation s’accompagnera d’une réflexion sur l’interface utilisateur.

 

Vous êtes dynamique, rigoureux et curieux, sensibilisé au travail en équipe en mode Agile.

 

Compétences requises :

- Programmation en C

- Environnement Unix/Linux

- Algorithmique distribuée

- MPI

 

Connaissances souhaitées

- Git

- Le standard Portals4

- Slurm

- Anglais technique

 

Durée : 6 mois

Site : Atos Echirolles (38) Télétravail possible

Mots-clés : calcul distribué, réseaux rapides, HPC, MPI, communications collectives.

 

 

Let’s grow together.