Site Relialibity Engineer (F/H)
Échirolles, FR
Bull is a story. One with a century of European innovation and a working environment where experts design powerful, sustainable, and sovereign digital solutions, enabling states and industries to retain full control over their data and their AI.
Bull is also thousands of engineers, researchers and passionate tech people shaping the future of high‑performance computing, AI, and quantum technologies.
Every day, our teams push the boundaries of what is technologically possible – from next‑generation HPC architectures to exascale supercomputers – supported by world‑class R&D, more than 1,600 patents, and unique end‑to‑end capabilities spanning hardware design, software engineering, data science and quantum research.
We are a people‑centric, innovation‑driven company, where collaboration spans Europe, the Americas and India. We share a common vision of a responsible and sustainable innovation that delivers concrete impact for our customers.
Bull est le leader du marché en Europe dans les segments des serveurs et des superordinateurs, reconnu pour ses innovations en intelligence artificielle, cybersécurité et quantique. Nos clients utilisent nos ordinateurs haute performance (HPC) pour des projets cruciaux tels que l'étude du changement climatique, la recherche de vaccins, la décarbonisation et les simulations scientifiques.
L'équipe Software Factory, au cœur de la division R&D HPC & AI, est responsable du développement et de l'exploitation (DevOps) d'une pile complète d'intégration et de livraison continues (CI/CD) pour les équipes de développement logiciel en charge des produits HPC et AI. Actuellement, notre plateforme gère plus de 500 builds par semaine sur une infrastructure hybride, combinant cloud public et laboratoire interne, garantissant une production logicielle entièrement automatisée. Nous recherchons un Site Reliability Engineer, qui jouera un rôle clé dans la gestion et l'optimisation de notre infrastructure.
Vos missions :
- Assurer la surveillance des systèmes et garantir le bon fonctionnement de l'infrastructure du laboratoire et des clusters HPC & AI ;
- Installer, mettre à jour et configurer les logiciels, firmwares et matériels ;
- Faire évoluer les architectures système et infrastructure pour intégrer de nouveaux matériels ;
- Maintenir une infrastructure de développement internationale à la pointe de la technologie ;
- Améliorer le SLA de la plateforme.
Votre profil :
- Vous êtes diplômé en informatique ;
- Vous avez une expérience en administration Linux ;
- Vous avez de bonnes compétences en programmation & scripting, administration des systèmes, plateformes cloud, conteneurs & orchestration (Docker et Kubernetes), surveillance & observabilité, pipelines CI/CD ;
- Vous possedez des connaissances en gestion des incidents, récupération après sinistre & haute disponibilité, meilleures pratiques de sécurité.
Compétences personnelles :
- Un bon relationnel : Excellentes compétences en communication verbale et écrite. Vous savez établir un contact efficace avec les différents interlocuteurs ;
- Un esprit d'équipe : Capacité à partager et travailler en équipe, à s'intégrer dans une équipe R&D en contexte Agile ;
- Une capacité à switcher du français à l’anglais en temps réel et de manière professionnelle dans le cadre d'animation d’ateliers, de réunions, de rédaction des contenus clairs et pédagogiques.
Pourquoi nous rejoindre :
- Un plan d'accès aux formations sur mesure et certifiantes ;
- Télétravail possible à hauteur de 60% du temps de travail ;
- L’accompagnement et suivi de votre évolution professionnelle ;
Localisation du poste :
Poste basé à Grenoble (site d'Echirolles).
Here, your ideas, your curiosity and your technical excellence directly shape the next era of advanced computing - unlocking enterprise value, accelerating scientific progress and driving positive impact for society.