Site Reliability Engineer (F/H)
Échirolles, FR
Bull c’est une histoire. Un siècle d’innovation Européenne et un environnement de travail où des experts conçoivent des solutions numériques puissantes, durables et souveraines, permettant aux États et aux industries de garder la pleine maîtrise de leurs données et de leur IA.
Bull c’est aussi des milliers d’ingénieurs, de chercheurs, de passionnés de tech, façonnant l’avenir du calcul de haute performance, de l’IA et des technologies quantiques.
Chaque jour, nos équipes repoussent les limites du possible - des architectures HPC de nouvelle génération aux supercalculateurs exascale - soutenues par une R&D de rang mondial, plus de 1 600 brevets et des capacités de bout en bout uniques, couvrant la conception matérielle, l’ingénierie logicielle, la data science et la recherche quantique.
Centrés sur l’humain et portés par l’innovation, où la collaboration s’étend à l’Europe, aux Amériques et à l’Inde, nous partageons cette même vision d’une innovation responsable et durable, avec un impact concret pour nos clients.
Bull est le leader du marché en Europe dans les segments des serveurs et des superordinateurs, reconnu pour ses innovations en intelligence artificielle, cybersécurité et quantique. Nos clients utilisent nos ordinateurs haute performance (HPC) pour des projets cruciaux tels que l'étude du changement climatique, la recherche de vaccins, la décarbonisation et les simulations scientifiques.
L'équipe Software Factory, au cœur de la division R&D HPC & AI, est responsable du développement et de l'exploitation (DevOps) d'une pile complète d'intégration et de livraison continues (CI/CD) pour les équipes de développement logiciel en charge des produits HPC et AI. Actuellement, notre plateforme gère plus de 500 builds par semaine sur une infrastructure hybride, combinant cloud public et laboratoire interne, garantissant une production logicielle entièrement automatisée. Nous recherchons un Site Reliability Engineer, qui jouera un rôle clé dans la gestion et l'optimisation de notre infrastructure.
Vos missions :
- Assurer la surveillance des systèmes et garantir le bon fonctionnement de l'infrastructure du laboratoire et des clusters HPC & AI ;
- Installer, mettre à jour et configurer les logiciels, firmwares et matériels ;
- Faire évoluer les architectures système et infrastructure pour intégrer de nouveaux matériels ;
- Maintenir une infrastructure de développement internationale à la pointe de la technologie ;
- Améliorer le SLA de la plateforme.
Votre profil :
- Vous êtes diplômé en informatique ;
- Vous avez une expérience en administration Linux ;
- Vous avez de bonnes compétences en programmation & scripting, administration des systèmes, plateformes cloud, conteneurs & orchestration (Docker et Kubernetes), surveillance & observabilité, pipelines CI/CD ;
- Vous possedez des connaissances en gestion des incidents, récupération après sinistre & haute disponibilité, meilleures pratiques de sécurité.
Compétences personnelles :
- Un bon relationnel : Excellentes compétences en communication verbale et écrite. Vous savez établir un contact efficace avec les différents interlocuteurs ;
- Un esprit d'équipe : Capacité à partager et travailler en équipe, à s'intégrer dans une équipe R&D en contexte Agile ;
- Une capacité à switcher du français à l’anglais en temps réel et de manière professionnelle dans le cadre d'animation d’ateliers, de réunions, de rédaction des contenus clairs et pédagogiques.
Pourquoi nous rejoindre :
- Un plan d'accès aux formations sur mesure et certifiantes ;
- Télétravail possible à hauteur de 60% du temps de travail ;
- L’accompagnement et suivi de votre évolution professionnelle ;
Localisation du poste :
Poste basé à Grenoble (site d'Echirolles).
#Eviden
Ici, vos idées, votre curiosité et votre excellence technique contribuent directement à façonner la prochaine ère du calcul avancé - en créant de la valeur pour les entreprises, en accélérant le progrès scientifique et en générant un impact positif pour la société. #Bull