Ce rôle propose la possibilité de travailler dans une équipe agile au sein d'un secteur de recherche sur une plateforme de calcul haute-performance.
Objet du poste
L'objectif principal est de collaborer avec les membres de l'équipe pour améliorer et déployer des solutions efficaces en infrastructure Linux.
Compétences requises
- Avoir un minimum de 3 ans d'expérience en tant que spécialiste en infrastructure Linux
- Avoir une connaissance solide des systèmes d'exploitation des serveurs Linux
- Avoir de l'expérience avec des solutions d'automatisation telles qu'Ansible, AWX, etc.
- Avoir une bonne connaissance de divers systèmes de surveillance tels que Nagios, Shinken, Zabbix, etc.
- Avoir la capacité de suivre des performances à l'aide de outils tels que Grafana, Prometheus, Cacti, etc.
- Avoir une bonne connaissance des outils de gestion de serveurs tels que Foreman, Satellite, etc.
- Avoir de l'expérience avec des infrastructures de gestion des logs tels que Elasticsearch, Kibana, Fluentd, etc.
- Avoir une connaissance des outils de messaging tels que Kafka, etc.
- Avoir de l'expérience dans le durcissement des serveurs Linux
- Avoir de l'expérience en gestion d'infrastructure de conteneurs tels que Kubernetes, OpenShift, etc.
- Avoir une bonne connaissance des pratiques en sécurité Linux
- Connaître le fonctionnement d'outils de répartition de charge tels que BigIP, HAproxy, etc.
- Avoir des habiletés à effectuer des travaux opérationnels
- Démontrer une capacité à offrir un service à la clientèle adéquat
Expériences souhaitées
- Connaître l'écosystème Jupyter (JupyterHub, JupyterLab, Jupyter Notebooks) et ses technologies web sous-jacentes ; son déploiement et son utilisation
- Connaître les éléments d'une plateforme de calcul haute-performance (HPC). Principalement : Slurm, FreeIPA et Ceph (RGW / S3 et CephFS)
- Automatiser des infrastructures (Configuration as Code et Infrastructure as Code) avec Ansible et AWS CDK
- Programmer à l'aide des langages Bash, Python et Typescript
- Familiarité avec des méthodologies de développement comme GitFlow, l'intégration continue (CI) / le déploiement continu (CD) et les GitHub Actions
- Déploier automatiquement des serveurs Linux (PXE, Kickstart)
- Gérer et utiliser des systèmes de virtualisation sous Linux (Proxmox, KVM, etc.)
- Déploier, gérer et utiliser des infrastructures Kubernetes (kubeadm, kOps, kubectl, kustomize etc.) et des technologies associées comme Docker et Podman
- Connaissances en administration de systèmes Linux :
- Distributions Linux : RHEL, Rocky Linux, Oracle Linux, Amazon Linux, CoreOS
- Gestion des utilisateurs
- Connaissance de base de la réseautique (Routage, DHCP, DNS, etc.)
- Atouts
- Certification Azure et connaissance du langage Bicep
- Certification AWS ou toute expérience jugée équivalente
- Expérience avec l'utilisation d'une plateforme de calcul haute-performance
- Intérêt pour le domaine de l'enseignement et de la recherche
- Expérience de travail dans un environnement Agile / SAFe
Durée et lieu de travail
Le contrat aura une durée de 26 semaines avec quatre options de renouvellement d'une durée de 26 semaines. Le travail se fera en mode hybride, ce qui signifie que vous aurez besoin de passer une journée par semaine en présentiel.
Contact : Si vous êtes intéressé par ce poste, veuillez envoyer votre candidature au conseiller en acquisition de talents mentionné ci-dessus.
Infrastructure Linux • Québec, Quebec, Canada