Overview
Nous recherchons un Architecte Systeme pour intégrer l'équipe d'un client basé à Rueil-Malmaison, il s'agit d'une opportunité en pre-embauche.
Responsabilités
- Travailler en étroite collaboration avec les équipes d'infrastructure et d'exploitation du département pour concevoir de nouvelles solutions autour du calcul par le GPU.
- Gérer les applications GPU, de calcul et de réseau sur des plateformes convergentes x86 / arm64, et soutenir les opérations de production.
- Avoir des connaissances en entraînement à l'IA à moyenne et grande échelle et comprendre les principales bibliothèques utilisées pour l'entraînement NLP / LLM / VLA (NeMo Framework, DeepSpeed, etc.).
- Être familier avec les serveurs multi-GPU (NVLink).
- Collaborer avec les équipes internes pour comprendre les besoins spécifiques.
- Optimiser l'environnement GPU et assurer la résilience de l'infrastructure.
- Travailler avec les équipes d'ingénierie et de produits pour répondre aux besoins de production.
- Résoudre les problèmes complexes de GPU et de calcul à l'aide d'outils spécialisés.
Profil candidat
- Stack technique: GPU, CUDA, ROCm, DGX, serveurs multi-GPU
- VMware, KVM, Hyper-V
- AWS, Azure, GCP…
- Slurm, PBS
- Python / Bash
- HPC
- Diplômé d'un master en informatique, science des données, génie électrique ou équivalent, vous possédez au minimum 8 ans d'expérience professionnelle post-diplôme dans les fondamentaux des réseaux, la pile TCP / IP et l'architecture des centres de données.