Job Search and Career Advice Platform

Enable job alerts via email!

SRE

Ringover France

Montreal (administrative region)

On-site

CAD 90,000 - 120,000

Full time

Today
Be an early applicant

Generate a tailored resume in minutes

Land an interview and earn more. Learn more

Job summary

Une entreprise technologique à Montréal recherche un Ingénieur SRE Senior responsable de la conception et de la supervision des plateformes. Les missions incluent l'optimisation des systèmes de monitoring, l'adaptation aux architectures microservices, et le maintien de la sécurité des infrastructures. Le candidat idéal possède une expertise en observabilité, Kubernetes et réseau Juniper, et un fort leadership technique.

Responsibilities

  • Définir la stratégie globale de métriques et alerting.
  • Construire des dashboards avancés pour la supervision.
  • Assurer le run des composants de supervision sur Kubernetes.
  • Garantir la sécurité des secrets et des flux de supervision.
  • Former les équipes aux bonnes pratiques de supervision.

Skills

Observabilité
Kubernetes (OKD)
Infrastructure Réseau Juniper
Leadership Technique
Analyse de Données

Tools

Prometheus
Victoria Metrics
ClickHouse
Helm
OpenBao
Job description

L’Ingénieur SRE Senior est le garant de la conception, de l’évolution et de la supervision de nos plateformes. Ton rôle est structurant et s’articule autour de trois piliers majeurs : une maîtrise totale de l’Observabilité, une expertise Kubernetes (OKD) et une solide compréhension des infrastructures réseau Juniper.

Ton objectif : définir et déployer les standards de monitoring, d’alerting et de mesure de performance pour offrir une visibilité fiable et actionnable sur nos systèmes distribués à forte volumétrie. Plus qu'un expert technique, tu es un moteur de la culture observabilité au sein de l'organisation.

Tes missions
Pilotage de l’Observabilité (Cœur du poste)
  • Stratégie & Design : Définir la stratégie globale (métriques, logs, alerting, capacité) et concevoir les architectures de monitoring à grande échelle.

  • Optimisation Tech : Exploiter et optimiser nos plateformes Prometheus, Victoria Metrics et ClickHouse.

  • Fiabilité : Construire des dashboards avancés (comportement système, performance) et mettre en place les indicateurs clés (SLIs, SLOs).

  • Anticipation : Garantir la pérennité des données et anticiper les enjeux de scalabilité liés à la volumétrie.

Plateforme & Kubernetes
  • Maintien : Assurer le run des composants de supervision sur Kubernetes (OKD).

  • Industrialisation : Déployer et maintenir les stacks via Helm.

  • Évolution : Adapter les mécanismes de monitoring aux architectures microservices et participer activement aux choix techniques de la plateforme.

Sécurité & Réseau
  • Secrets : Gérer les accès et la sécurité des secrets via OpenBao.

  • Sécurisation : Garantir le chiffrement, l'authentification et le RBAC des flux de supervision.

  • Synergie Réseau : Collaborer avec les équipes réseau sur la partie Juniper et intégrer ces contraintes dans tes designs d’architecture.

Leadership & Transmission
  • Force de proposition : Porter la vision technique sur les sujets de supervision.

  • Accompagnement : Former les équipes aux bonnes pratiques et diffuser les guidelines internes.

  • Veille : Maintenir un haut niveau d'expertise sur les nouveaux patterns et outils du marché.

Tes Soft Skills
  • Leadership technique & Pédagogie : Tu sais transmettre ton savoir, coacher les équipes et rendre les concepts complexes accessibles.

  • Esprit d'analyse et de synthèse : Face à une forte volumétrie de données, tu sais extraire l'information critique et prendre des décisions rapides.

  • Culture du résultat et de la fiabilité : Tu es obsédé par la disponibilité des systèmes et la pertinence des alertes (zéro bruit inutile).

  • Communication transversale : Tu es capable de dialoguer aussi bien avec des développeurs qu'avec des ingénieurs réseau ou sécurité pour aligner les pratiques.

  • Curiosité intellectuelle : La veille n'est pas une option pour toi, tu cherches constamment à améliorer l'existant.

Stack Technique
  • Observabilité : Prometheus, Victoria Metrics, ClickHouse.

  • Orchestration : Kubernetes (OKD), Helm.

  • Sécurité : OpenBao.

  • Réseau : Infrastructure Juniper.

  • Contexte : Systèmes distribués, forte volumétrie, Cloud-native.

Get your free, confidential resume review.
or drag and drop a PDF, DOC, DOCX, ODT, or PAGES file up to 5MB.