- +1
- France
À propos
Outscale est un opérateur souverain et durable de l’Expérience en tant que Service qui offre à ses clients des environnements technologiques de confiance.
Nous offrons des expériences uniques grâce au savoir-faire de nos équipes passionnées, qui se reflète notamment par la création de solutions de Business Expériences, le développement de notre propre orchestrateur Cloud, TINA OS, ou encore l’obtention de la qualification SecNumCloud.
Intégré(e) à l’équipe AI Factory d’OUTSCALE, vous assurez l’exploitation, l’optimisation et l’évolution des usines à GPU (clusters NVIDIA) à l’échelle globale (Europe, Amérique du Nord, Asie). Vous êtes en charge de garantir la disponibilité, la performance, la sécurité des plateformes de stockage qui alimentent les demandes d’IA.
Vos missions
Conception & mise en œuvre de solutions de stockage IA
Définir l’architecture stockage (objets, blocs, fichiers) pour les besoins d’IA et du cloud OUTSCALE.
Dimensionner les clusters afin de soutenir les charges GPU intensives.
Déploiement d’un stockage objet exaoctet compatible S3
Créer et maintenir un service objet (MinIO, Ceph RGW, etc.) capable de s’étendre à l’exaoctet.
Intégrer ces clusters dans les environnements clients (public, privé, hybride).
Exploitation des technologies haute performance
Utiliser RDMA, GPUDirectStorage, SPDK et les systèmes de fichiers distribués (Ceph, Lustre, BeeGFS, DAOS)
Optimiser le chemin de données GPU stockage pour minimiser latence et CPU overhead.
Fiabilité, durabilité & observabilité
Mettre en place des mécanismes de réplication, d’érasurecoding, de snapshots et de sauvegarde/PRA.
Développer tableaux de bord (Prometheus/Grafana) et indicateurs (latence I/O, débit, taux d’erreur).
Support opérationnel & dépannage
Surveiller les systèmes en production, analyser les alertes, corriger les incidents.
Gestion du ticketing Niveau2.
Collaboration & suivi client/fournisseur :
Travailler avec les équipes Ops, Cloud, Sécurité et les fournisseurs de matériel (NVIDIA, NetApp, PureStorage…).
Assurer le suivi des demandes d’évolution et des SLA avec les clients internes/externes.
Analyse télémétrie & amélioration continue
Collecter et exploiter les métriques et traces (DCGM Exporter, logs, fluxtélémétriques).
Proposer des optim isations (tuning PFC/ECN, réglage du BIOS, configuration du réseau RDMA).
Documentation :
Rédiger procédures, diagrammes d’architecture et tenir à jour le wiki Confluence/NetBox.
Veille technologique
Suivre les évolutions de SPDK, GPUDirectStorage, protocoles objet à grande échelle et standards RDMA.
Réaliser des proofofconcept (NVMeoF, RDMA over Converged Ethernet).
Stack technique
Solide expérience avec stockage objet (S3, MinIO, Ceph RGW) ou Systèmes de fichiers distribués (Ceph, Lustre, BeeGFS, DAOS).
Maîtrise d’un langage de programmation système : Go, C ou Rust.
Connaissance approfondie des protocoles de stockage (S3, NFS, NVMeoF, RDMA).
Compétences complémentaires (au moins 2 parmi les suivantes) :
Plateforme GPU: NVIDIA DGX/HGX, NVLink/NVSwitch, GPUOperator (K8s)
Stockage: NetApp, PureStorage, BeeGFS, Ceph, Lustre, ZF, NFSv4.1/pNFS
Réseau stockage: InfiniBand HDR/NDR, Ethernet Spectrum (RoCEv2), ConnectX6/7, tuning PFC/ECN.
Automatisation: Ansible, Terraform, Git/GitLabCI.
Administration Linux (kernel tuning, udev)
Outils de supervision: Prometheus, Grafana, DCGM Exporter, Zabbix, NetBox.
Votre profil
Diplômé(e) en ingénierie informatique, vous possédez une expérience professionnelle minimum post-diplôme de 2 ans, en environnement de production sur le stockage objet ou les systèmes de fichiers distribués.
Vous parlez anglais et français couramment.
Vous appréciez travailler en équipe et possédez un bon relationnel.
Rigoureux, autonome et réactif, vous êtes naturellement force de proposition.
Nous rejoindre c'est aussi
Intégrer une entreprise scientifique au cœur de l’innovation technologique, portée par une forte croissance depuis plus de 40 ans
Principaux avantages et bénéfices :
Environnement multiculturel
Cadre de travail convivial axé sur le bien-être et la santé
Engagement en faveur de la diversité et de l’inclusion
Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc.
Inclusion statement
As a game-changer in sustainable technology and innovation, Dassault Systèmes is striving to build more inclusive and diverse teams across the globe. We believe that our people are our number one asset and we want all employees to feel empowered to bring their whole selves to work every day. It is our goal that our people feel a sense of pride and a passion for belonging. As a company leading change, it’s our responsibility to foster opportunities for all people to participate in a harmonized Workforce of the Future.
Expérience professionnelle
- Data Infrastructure
Compétences linguistiques
- English
- French