Activez les alertes d’offres d’emploi par e-mail !

Site Reliability Engineer - SRE Lille - H/F

Groupe iliad

Lille

Sur place

EUR 40 000 - 70 000

Plein temps

Il y a 30+ jours

Résumé du poste

Scaleway, la filiale cloud du groupe Iliad, recrute un Site Reliability Engineer à Lille. Dans un environnement dynamique et international, vous serez responsable d'assurer la fiabilité des produits, en collaborant avec différentes équipes et en utilisant des outils de monitoring et d'automatisation pour optimiser les systèmes. Une passion pour l'amélioration continues et une expertise technique sont essentielles pour réussir.

Qualifications

  • Expérience en développement en Go, Python ou Rust souhaitée.
  • Solide expérience en administration système et cloud.
  • Compréhension des réseaux informatiques et capacité à rédiger une documentation technique en anglais.

Responsabilités

  • Assurer la fiabilité des systèmes afin de servir les utilisateurs à travers le monde.
  • Troubleshooter les pannes des systèmes de production.
  • Gérer le cycle de vie des produits en production.

Connaissances

Développement en Go
Développement en Python
Développement en Rust
Administration de systèmes Linux
Cloud architecture
Scripting avec bash
Automation
Monitoring
Gestion de bases de données relationnelles
Excellente communication

Outils

PostgreSQL
RabbitMQ
HA Proxy
Nginx
Ansible
GitLab
Description du poste

Le poste

Fondée en 1999, Scaleway est la filiale cloud du groupe Iliad, l’un des leaders des télécommunications en Europe. Notre mission est de favoriser une industrie numérique plus responsable en aidant les développeurs et les entreprises à créer, déployer et adapter des applications à n'importe quelle infrastructure.Depuis nos bureaux situés à Paris et à Lille, nous perfectionnons quotidiennement l'écosystème cloud de Scaleway, dont nous sommes les premiers utilisateurs.Nos quelques 25 000 clients nous choisissent pour notre redondance multi-AZ, notre expérience-utilisateur fluide, nos datacenters neutres en carbone ainsi que nos outils natifs de gestion d'architectures multi-cloud. Nos produits incluent des solutions entièrement gérées pour le bare metal, la conteneurisation et les architectures serverless, offrant ainsi un choix responsable dans le domaine du cloud computing.Rejoignez notre équipe dynamique de près de 600 collaborateurs venant de divers horizons, dans un environnement stimulant et international alliant excellence technique, créativité et partage. About the job Scaleway is looking for a Site Reliability Engineer to join our teams.Reporting to a Lead SRE, you will be responsible to ensure we can reliably serve our products for users around the world. We expect you to have a strong background in development and system administration. Our systems evolve constantly and the tools needed to observe and act to ensure their resilience need to evolve accordingly.

Profil recherché

  • Previous experience as a developer in Go, Python or Rust
  • Experience in system programming with usual scripting languages (bash, Python)
  • Demonstrated ability to troubleshoot production systems failures
  • A great attitude and desire to work with a team
  • Passion for incremental improvements on tooling, love all things of automation
  • Experience with Linux systems (Ubuntu / Debian)
  • Experience with cloud environments architecture (baremetal, virtual machines, containers, orchestrators)
  • Good understanding of computer networks : TCP / IP, DNS, load-balancing, IPv6, BGP and network virtualisation
  • Understanding of written and spoken english, capable of writing technical documentation in English, ability to speak english if needed
  • Experience with infrastructure as code and continuous deployment
  • Experience dealing with physical hardware automation
  • Experience with monitoring & logging systems
  • Experience administering relational databases
  • Knowledge of one cloud platform and related use-cases
  • Take initiatives to propose new solutions and defend them
  • Team player, willing to share knowledge, opinions, and participate in regular team rituals
  • Good communication skills and coaching skills
  • Create or optimize existing tools & documentation that will help identify, diagnose and remediate production incidents, automating as much as possible
  • Troubleshoot high-impact issues working with multiple engineering teams
  • Take on-call responsibilities, mitigate issues encountered in production and secure the best real-time answer to our customers
  • Ensure a high quality of service for our customers by leveraging observability and monitoring technologies
  • Manage lifecycle of products in production
  • Help implementing best practices in stability, resiliency, scalability, security and performance across our systems
  • Python, Go, Rust
  • RabbitMQ
  • PostgreSQL
  • HA Proxy, Nginx, REST APIs / Flask
  • S3 API
  • Sentry, Prometheus, Grafana, ElasticSearch, Fluentd, Kibana
  • Ansible, AWX, Foreman, Salt
  • GitLab, Nexus
  • Ubuntu, Debian, CentOS
  • Jira, Confluence, Slack, GSuite

Location This position isbased in our offices in Paris or Lille (France)Si vous ne vous voyez pas cocher toutes les cases, n'hésitez pas à postuler tout de même. Ne vous limitez pas à une description de poste - on ne sait jamais ! ||

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.