Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Stage - Data Scientist

CSE GARES & CONNEXIONS

Nantes

Sur place

EUR 60 000 - 80 000

Plein temps

Il y a 29 jours

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise de transport ferroviaire recherche un stagiaire Data Scientist pour rejoindre son équipe Data. Le candidat participera à la collecte, le traitement et l'analyse de données pour des modèles de machine learning. Il doit avoir un BAC + 5 en Data Science et maîtriser Python et des outils de visualisation comme Power BI. Le stage est basé à Nantes, dans un environnement stimulant.

Qualifications

  • Compétences en traitement et intégration de données.
  • Maîtrise des bibliothèques data science.
  • Familiarité avec les méthodes agiles.

Responsabilités

  • Identifier, collecter, explorer et préparer les données.
  • Concevoir et déployer des modèles statistiques.
  • Produire des analyses exploratoires et visualisations.

Connaissances

Compétences en statistiques appliquées
Machine Learning
Python
ETL / ELT
Visualisation de données

Formation

BAC + 5 - Spécialité Data Science

Outils

Power BI
Docker
Azure ML
Description du poste

Rejoignez un environnement stimulant et des équipes passionnées qui mettent leur talent et leur savoir faire au service des gares de demain. Plus de 3 700 collaborateurs, présents sur l'ensemble du territoire, contribuent en effet à repenser l'avenir des gares et à les intégrer au coeur des projets urbains. La force de SNCF Gares & Connexions, c'est d'intégrer une grande variété de profils et de faire travailler ensemble des métiers très différents.

Sous la responsabilité du Responsable Data, le Stagiaire Data Scientist sera intégré au pôle Data Studio de SNCF G&C composé de Data Engineer, Data Scientist, Data Analyst, Data Manager. Il sera amené à intervenir sur toute la chaîne de valeur de la donnée : collecte, traitements, restitution, gouvernance.

En tant que Data Scientist, ses missions principales seront les suivantes :

Comprendre les enjeux stratégiques et opérationnels des métiers de la SA.

Identifier, collecter, explorer et préparer les données pertinentes issues de sources variées et complexes.

Concevoir, entraîner, évaluer et déployer des modèles statistiques et de machine learning (IA Gen, prédiction, classification, détection d'anomalies, segmentation, etc.).

Produire des analyses exploratoires approfondies, permettant d'identifier des tendances, corrélations ou comportements clés.

Industrialiser les modèles développés en collaboration avec l'équipe Infra et les Data Engineer

Développer des notebooks analytiques, scripts ou API permettant la mise à disposition des résultats.

Produire des visualisations et rapports d'interprétation des modèles pour faciliter la compréhension et la prise de décision des métiers.

Documenter les approches, les modèles, les choix méthodologiques et les résultats.

Durant son stage, il sera également amené à travailler sur des sujets de Data Visualisation pour répondre à des sujets transverses à l'équipe Data. A ce titre, il sera amené à :

Comprendre les besoins métier en participant à des ateliers de cadrage

Concevoir, modéliser et maintenir des modèles de données adaptés aux besoins

Développer et maintenir des pipelines de transformation assurant la fiabilité et la performance des flux de données

Produire des analyses et visualisations claires permettant aux équipes métiers de prendre des décisions éclairées

Industrialiser les modèles développés en collaboration avec l'équipe Infra et les Data Engineer

Sous la responsabilité du Responsable Data, le Stagiaire Data Scientist sera intégré au pôle Data Studio de SNCF G&C composé de Data Engineer, Data Scientist, Data Analyst, Data Manager. Il sera amené à intervenir sur toute la chaîne de valeur de la donnée : collecte, traitements, restitution, gouvernance.

En tant que Data Scientist, ses missions principales seront les suivantes :

Comprendre les enjeux stratégiques et opérationnels des métiers de la SA.

Identifier, collecter, explorer et préparer les données pertinentes issues de sources variées et complexes.

Concevoir, entraîner, évaluer et déployer des modèles statistiques et de machine learning (IA Gen, prédiction, classification, détection d'anomalies, segmentation, etc.).

Produire des analyses exploratoires approfondies, permettant d'identifier des tendances, corrélations ou comportements clés.

Industrialiser les modèles développés en collaboration avec l'équipe Infra et les Data Engineer

Développer des notebooks analytiques, scripts ou API permettant la mise à disposition des résultats.

Produire des visualisations et rapports d'interprétation des modèles pour faciliter la compréhension et la prise de décision des métiers.

Documenter les approches, les modèles, les choix méthodologiques et les résultats.

Durant son stage, il sera également amené à travailler sur des sujets de Data Visualisation pour répondre à des sujets transverses à l'équipe Data. A ce titre, il sera amené à :

Comprendre les besoins métier en participant à des ateliers de cadrage

Concevoir, modéliser et maintenir des modèles de données adaptés aux besoins

Développer et maintenir des pipelines de transformation assurant la fiabilité et la performance des flux de données

Produire des analyses et visualisations claires permettant aux équipes métiers de prendre des décisions éclairées

Industrialiser les modèles développés en collaboration avec l'équipe Infra et les Data Engineer

BAC + 5 - Spécialité Data Science, Intelligence artificielle, Statistiques appliquées :

Compétences en statistique appliquée, machine learning, deep learning

Compétences en traitement et intégration de données (ETL / ELT, data pipelines), et déploiement de modèles (Azure ML, API, Docker)

Maîtrise du langage Python, et notamment des principales bibliothèques data science (pandas, scikit-learn, numpy, matplotlib, seaborn, etc.)

Maîtrise des concepts de modélisation de données et des outils de transformation (SQL, dbt, etc.)

Connaissance des outils de visualisation (Power BI, Tableau, Looker...).

Connaissance des environnements cloud (Azure, Databricks, Azure ML).

Connaissance des bonnes pratiques de documentation, d'évaluation et de traçabilité des modèles

Familiarité avec les méthodes agiles et les environnements collaboratifs.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.