Activez les alertes d’offres d’emploi par e-mail !

Stage Data Science : Conception d'un simulateur d'échantillonnage avancé pour l'optimisation de[...]

Veolia

Aubervilliers

Sur place

EUR 60 000 - 80 000

Plein temps

Il y a 10 jours

Résumé du poste

Une entreprise de gestion environnementale recherche un stagiaire en Data Science pour modéliser des méthodes d’échantillonnage et développer un simulateur informatique. Vous serez impliqué dans des projets orientés vers la transition écologique, en utilisant des statistiques et des techniques de machine learning pour optimiser les protocoles d’échantillonnage.

Prestations

Environnement stimulant
Opportunités d’évolution
Team buildings

Qualifications

  • Solides connaissances en statistiques, analyse de données et data visualisation.
  • Capacité à vulgariser des concepts complexes et à travailler en équipe pluridisciplinaire.
  • Bonne communication écrite et orale.

Responsabilités

  • Réaliser une étude bibliographique sur les méthodes d’échantillonnage.
  • Concevoir un modèle mathématique pour simuler l’impact des paramètres d’échantillonnage.
  • Développer un simulateur informatique permettant d’optimiser les protocoles.

Connaissances

Statistiques
Analyse de données
Data visualisation
Programmation (Python, R)
Machine learning
Deep learning

Formation

Niveau Master 2 ou BAC+5 en Statistiques ou Data science

Outils

scikit-learn
TensorFlow
PyTorch
OpenModelica
Description du poste

Description de l\'entreprise

Le groupe Veolia a pour ambition de devenir l’entreprise de référence de la transformation écologique.

Présent sur les cinq continents avec près de 215 000 salariés en 2025, le Groupe conçoit et déploie des solutions utiles et concrètes pour la gestion de l’eau, des déchets et de l’énergie qui participent à changer radicalement la donne.

Au travers de ses trois activités complémentaires, Veolia contribue à développer l’accès aux ressources, à préserver les ressources disponibles et à les renouveler. En 2025, Veolia a servi 111 millions d’habitants en eau potable et 98 millions en assainissement, produit près de 42 tétrawattheures et valorisé 65 millions de tonnes de déchets.

La Direction des Expertises Scientifiques et Technologiques (DEST) se situe au cœur de la stratégie de Veolia pour aider le Groupe à devenir l\'entreprise de référence de la transformation écologique. Les expertises scientifiques et technologiques sont un des moteurs de l\'évolution du Groupe. DEST a pour mission de répondre aux besoins des entités opérationnelles et de promouvoir l\\excellence scientifique et technologique au sein du Groupe.

Nous croisons les disciplines et les expertises pour contribuer au développement de solutions qui permettent de faciliter l’accès aux services essentiels et aux ressources naturelles, de préserver celles-ci et de les utiliser et de les recycler efficacement. Nous intégrons les propositions innovantes de nos partenaires scientifiques et techniques et les développons, nous expérimentons au plus près du terrain.

Objectifs

  • Dans le cadre des projets de recherche menés chez DEST, nous avons de nombreux moyens analytiques pour mesurer les propriétés de matières solides en vue de déterminer leur composition, ou d’analyser leur impact sur l’environnement, ou bien d’étudier leur recyclabilité, entre autres exemples.

  • Ces matières se présentent souvent sous forme de gisements, en vrac, avec des mélanges non homogènes, une granularité variée, et la possibilité d’effets pépites qui faussent les résultats. Leur analyse nécessite des méthodes de prélèvement et d’échantillonnage rigoureuses, afin d’obtenir des échantillons représentatifs de l’ensemble du gisement.

  • La théorie de Gy donne un cadre scientifique reconnu pour l’échantillonnage des matières solides. Elle permet de modéliser et de quantifier les erreurs d’échantillonnage lors de la prise d’échantillons de matériaux hétérogènes. Cette théorie fournit des outils mathématiques pour optimiser les protocoles d’échantillonnage, en tenant compte des paramètres physiques et statistiques, afin de garantir la représentativité des échantillons et de minimiser l’erreur de mesure.

  • Dans le cadre de ce stage, la théorie de Gy sera utilisée pour modéliser l’impact des choix d’échantillonnage sur la précision des analyses, le but final sera de développer un simulateur permettant de tester différents scénarios d’échantillonnage.

  • Vous aurez l’opportunité de mettre en pratique vos compétences en data science et statistiques sur des données réelles issues de problématiques industrielles concrètes, en développant un outil innovant qui contribuera directement à l’excellence scientifique et aidera de nombreux contributeurs clés sur les thématiques de transition écologique.

Missions principales
  • Réaliser une étude bibliographique sur les méthodes d’échantillonnage, les modèles génératifs (GANs, VAE) et les outils de data visualisation adaptés

  • Prendre en main la théorie de Gy (Pierre Gy) pour l’échantillonnage des matières solides et comprendre ses enjeux dans le contexte industriel

  • Concevoir un modèle mathématique permettant de simuler l’impact des paramètres d’échantillonnage sur l’erreur de mesure, l’évaluer et le valider

  • Explorer et implémenter des modèles génératifs (GANs, VAE) pour simuler des distributions de particules réalistes dans les gisements, permettant de créer des scénarios d\'échantillonnage variés et représentatifs

  • Développer un simulateur informatique (Python ou R) permettant d’intégrer le modèle, de tester différents scénarios d’échantillonnage et d’optimiser les protocoles, avec une interface permettant de choisir les paramètres et de présenter les résultats de manière claire et intuitive

  • Développer un modèle de recommandation intelligent utilisant des techniques de machine learning pour suggérer automatiquement les paramètres d\'échantillonnage optimaux selon les caractéristiques spécifiques du gisement

  • Implémenter des techniques d\'explicabilité (SHAP/LIME) pour analyser et visualiser l\'impact de chaque paramètre sur les résultats, facilitant la compréhension et la prise de décision

  • Présenter les travaux réalisés sous forme de rapport, de présentations, de démonstrations de l’outil, de manuel utilisateur

Qualifications
  • Formation

Niveau Master 2 ou élève en école d’ingénieur (BAC+5) en spécialisation Statistiques, Data science, mathématiques appliquées

  • Vos compétences

  • Solides connaissances en statistiques, analyse de données, et data visualisation

  • Solides compétences en programmation (Python, R)

  • Connaissance des frameworks de machine learning et deep learning (scikit-learn, TensorFlow ou PyTorch)

  • Intérêt ou expérience avec les modèles génératifs (GANs, VAE) serait un plus

  • Familiarité avec les techniques d\'explicabilité des modèles (SHAP, LIME) appréciée

  • Connaissance des outils de modélisation système type OpenModelica appréciée

  • Capacité à vulgariser des concepts complexes et à travailler en équipe pluridisciplinaire

  • Bonne communication écrite et orale

Vos qualités, votre savoir-être
  • Rigueur scientifique et autonomie

  • Curiosité, esprit d’initiative et force de proposition

  • Créativité : l\'application des compétences analytiques à des situations réelles ne vous fait pas peur

  • Intérêt pour les problématiques industrielles et environnementales

Informations supplémentaires

Nos valeurs : Responsabilité, Respect, Solidarité, Innovation, Sens du client

Environnement de travail:

  • Environnement stimulant
  • team buildings, créativité, innovation
  • croisement des expertises et des disciplines
  • des sujets de travail renouvelés pour découvrir et grandir
  • une vision large des enjeux et des activités de Veolia pour ressourcer le monde
  • un accompagnement pour se développer professionnellement
  • les opportunités d’évolution au sein d’un groupe mondial

En tant qu\'entreprise inclusive, Veolia s\’engage pour la diversité et accorde la même considération à toutes les candidatures, sans discrimination.

Pour postuler merci de joindre dans l\'onglet “pièces jointes” CV et lettre de motivation en format PDF (nommés de la manière suivante : Nom Prénom_CV et Nom Prénom_LM)

En tant qu\'entreprise inclusive, Veolia s’engage pour la diversité et accorde la même considération à toutes les candidatures, sans discrimination.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.