Administrateur Systeme Linux HPC H/F
Bruyères-le-Châtel, FR
Bull c’est une histoire. Un siècle d’innovation Européenne et un environnement de travail où des experts conçoivent des solutions numériques puissantes, durables et souveraines, permettant aux États et aux industries de garder la pleine maîtrise de leurs données et de leur IA.
Bull c’est aussi des milliers d’ingénieurs, de chercheurs, de passionnés de tech, façonnant l’avenir du calcul de haute performance, de l’IA et des technologies quantiques.
Chaque jour, nos équipes repoussent les limites du possible - des architectures HPC de nouvelle génération aux supercalculateurs exascale - soutenues par une R&D de rang mondial, plus de 1 600 brevets et des capacités de bout en bout uniques, couvrant la conception matérielle, l’ingénierie logicielle, la data science et la recherche quantique.
Centrés sur l’humain et portés par l’innovation, où la collaboration s’étend à l’Europe, aux Amériques et à l’Inde, nous partageons cette même vision d’une innovation responsable et durable, avec un impact concret pour nos clients.
Environnement de travail
Le poste est basé sur le site du CEA à Bruyères-le-Châtel, à proximité du centre de compétences Ter@tec. Vous rejoindrez une équipe pluridisciplinaire composée de techniciens, d’ingénieurs en maintenance matérielle, d’ingénieurs systèmes et d’un support L3, tous dédiés au maintien en condition opérationnelle de clusters HPC classés dans le TOP500.
Missions principales
- Administration des systèmes HPC, incluant les supercalculateurs et les systèmes de stockage associés
- Installation logicielle, optimisation des configurations et maintien en conditions opérationnelles de plusieurs milliers de nœuds de calcul
- Préparation et exécution des opérations de maintenance logicielle
- Mise en place de solutions de haute disponibilité (HA, Pacemaker, Corosync)
- Développement de procédures d’automatisation via des scripts (Bash, Python)
- Rédaction de documentations techniques et de procédures d’exploitation
- Analyse, diagnostic et résolution d’incidents de production
- Qualification, résolution ou escalade des tickets clients vers les structures de support internes ou partenaires
- Création et suivi des dossiers d’escalade technique auprès des équipes de support L2 et L3
- Support de niveau 1 et 2 sur la stack logicielle fournie par le client (basée sur CentOS)
Profil recherché
Formation : Bac +5 minimum en informatique ou domaine technique équivalent
Compétences techniques attendues (tout ou partie) :
- Administration de systèmes GNU/Linux HPC (Red Hat, CentOS ou équivalents)
- Connaissance du système de fichiers Lustre
- Réseaux : Interconnect, InfiniBand, Ethernet, RoCE
- Conteneurs : Docker, OpenStack
- Orchestrateurs : Puppet, Ansible
- Scripting : Shell, Python, Perl
- Configuration des services Linux : DNS, DHCP, Web, FTP, authentification, déploiement
- Supervision : Nagios
- Infrastructure : commutateurs réseau, serveurs x86, baies de disques (DDN, ClusterStor)
- Bases en langage C pour l’analyse et la compilation de code
Langues : Français courant, anglais technique opérationnel
Qualités personnelles
- Engagement et passion pour les environnements techniques exigeants
- Capacités d’analyse et de débogage, ténacité dans la recherche de solutions
- Rigueur, persévérance et sens du détail
- Curiosité et goût pour les nouvelles technologies
- Esprit d’équipe, bon relationnel et communication claire
- Dynamisme, autonomie et proactivité
- Force de proposition
Ce poste implique des astreintes 24/7, environ une semaine par mois. Il est basé dans un environnement classifié, nécessitant une habilitation "Secret Défense".
Ici, vos idées, votre curiosité et votre excellence technique contribuent directement à façonner la prochaine ère du calcul avancé - en créant de la valeur pour les entreprises, en accélérant le progrès scientifique et en générant un impact positif pour la société.