Loading...
Share this Job

Stage R&D - Modélisation de l'accélération de transfert de données par apprentissage machine - H/F

Publish Date:  Dec 29, 2020
Location: 

Grenoble - 38, Rhône-Alpes, FR

Company:  Atos

À propos d’Atos

Atos est un leader international de la transformation digitale avec 110 000 collaborateurs et un chiffre d’affaires annuel de 12 milliards d’euros. Numéro un européen du cloud, de la cybersécurité et des supercalculateurs, le groupe fournit des solutions intégrées pour tous les secteurs, dans 73 pays. Pionnier des services et produits de décarbonation, Atos s’engage à fournir des solutions numériques sécurisées et décarbonées à ses clients. Atos opère sous les marques Atos et Atos|Syntel. Atos est une SE (Société Européenne) cotée sur Euronext Paris et fait partie de l’indice CAC 40.

La raison d’être d’Atos est de contribuer à façonner l’espace informationnel. Avec ses compétences et ses services, le groupe supporte le développement de la connaissance, de l’éducation et de la recherche dans une approche pluriculturelle et contribue au développement de l’excellence scientifique et technologique. Partout dans le monde, Atos permet à ses clients et à ses collaborateurs, et plus généralement au plus grand nombre, de vivre, travailler et progresser durablement et en toute confiance dans l’espace informationnel.

 

 

 

Contexte

Au sein de la division R&D HPC et Big Data SW, dans le groupe agile Data Management, nous développons les solutions de stockage de données de très haute performance qui seront au cœur des futurs calculateurs exascale « data centric ». Nous développons notamment des accélérateurs logiciels et matériels de mouvement de données entrantes et sortantes (I/O), permettant d’éviter le ralentissement d’applications véhiculant des données massives. Ces accélérateurs possèdent de nombreux paramètres dont le choix a un fort impact sur la performance de l’application et l’efficacité de l’accélérateur. Nous cherchons à établir un modèle permettant de prédire l’effet de l’accélérateur sur un type d’IO bien défini dans un premier temps, puis sur une application.
Afin d’atteindre cet objectif nous tenterons des caractérisations in-situ (dans les conditions d’exécution de l’application) de l’effet de l’accélérateur sur des phases d’échange de données. Il s’agit de générer des IO synthétiques, de mesurer l’effet de l’accélérateur et de conserver les performances mesurées dans un modèle qui approximera la fonction recherchée.
Pour cela nous décomposerons les paquets d’IO en groupes aux caractéristiques communes proches de celles réalisées ou véhiculées par l’application afin d’étudier la reproductibilité de l’accélération à paramètres fixés. Si cette hypothèse se vérifie sur cette IO propre, nous tenterons alors de décrire tous les mouvements de données issus d’un workflow comme une combinaisons ou superposition d’IO caractérisables. 
La récupération des traces d’exécution d’un workflow permettra enfin de reconstituer les différentes étapes IO et calcul à travers un modèle de décomposition de série temporelle multivariée. Une fois cette décomposition obtenue, en appliquant le modèle de l’accélérateur, on peut estimer l’accélération attendue à travers la succession de phases IO qui constituent le workflow. Ainsi, il sera possible de prédire l’effet d’un accélérateur à paramètres fixés sur une application instrumentée.

 

Mission

Dans ce contexte, le groupe Data Management recherche un(e) stagiaire niveau Bac+5 intéressé(e) par les problématiques de Data Science avec un maîtrise solide en résolution de problèmes analytiques.
Intégré(e) dans une équipe mixte d’experts IO en HPC et de Data Scientists, votre mission sera de :

  • Réaliser un état de l’art sur les comportements IO et la modélisation de leur accélération. 
  • Etablir et implémenter un modèle qui décrit l’effet d’accélération à partir des données collectées in-situ.
  • Optimiser ce modèle, en créer des variations, et établir un comparatif sur les performances obtenues.
  • Structurer le code d’implémentation sous la forme d’une bibliothèque Python.

 

Profil

Actuellement en dernière année du cycle de formation Bac+5 (Ingénieur, Master, ...), vous avez des bases solides en modélisation et en résolution de problèmes analytiques. Une culture en Data Science sera appréciée. 
Stage d’une durée de 6 mois 

  • Vous possédez des compétences en traitement de données, en statistiques et en apprentissage automatique. Vous maîtrisez l’écosystème Python pour le traitement de données (numpy, scipy, pandas, scikit-learn, …, php). Dans ce contexte, vous êtes à l’aise dans la manipulation et la transformation de données. De plus, vous maîtrisez la programmation orientée objet et vous pouvez évoluer dans un environnement Linux.
  • Des notions en base de données orientées document (MongoDB) seraient un plus.
  • De bonnes capacités rédactionnelles et une expérience en rédaction scientifique seraient un plus (possibilité de rédaction d’article, de dépôt de brevet …).
  • Vous avez un bon niveau d'anglais.
  • Passionné(e) par l’innovation, vous faîtes preuve de curiosité, d'autonomie et d’esprit d’initiative.

 

Contact : salim.mimouni@atos.net

 

INFORMATIONS ADDITIONNELLES :

Chez Atos, nous voulons que nos employés se sentent valorisés, appréciés et libres d'être eux-mêmes au travail. Nos process RH sont conçus pour prévenir la discrimination envers l'identité ou l'orientation sexuelle, la religion, l’origine ethnique, l'âge, la neurodiversité, le handicap, la citoyenneté ou tout autre aspect qui rend nos collaborateurs uniques. Partout dans le monde, nous avons créé plusieurs programmes pour soutenir la culture inclusive d'Atos, et nous travaillons pour nous assurer que tous nos collaborateurs aient une chance égale de sentir qu'ils sont exactement là où ils doivent être.