Activez les alertes d’offres d’emploi par e-mail !

Stage - IA Générative:application des Transformers à la création de traces synthétiques de mobi[...]

Orange SA

Belfort

Sur place

EUR 40 000 - 60 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Résumé du poste

Une entreprise de technologie recherche un stagiaire pour développer des algorithmes générant des traces synthétiques. Le candidat doit avoir un Bac +5 en mathématiques appliquées, une bonne connaissance des modèles génératifs et des compétences en Python. Ce stage se concentre sur l'analyse de données de mobilité et appliquera des méthodes d'apprentissage profond.

Qualifications

  • Formation supérieure Bac +5 en mathématiques appliquées, informatique, data science ou domaine similaire.
  • Connaissances en machine learning/deep learning et modèles génératifs.
  • Maîtrise de l'environnement Python pour la data science.

Responsabilités

  • Contribuer au développement d'algorithmes générant des traces synthétiques.
  • Étudier la littérature scientifique sur les modèles génératifs.
  • Prototyper et évaluer les architectures sur des données de mobilité réelles.

Connaissances

Machine Learning
Deep Learning
Python
Communication skills

Formation

Bac +5 (Ecole d'ingénieur ou Université)

Outils

PyTorch
TensorFlow
scikit-learn
pandas
numpy
Description du poste
about the role

Avec Flux Vision, Orange développe depuis plusieurs années une solution innovante permettant de produire des indicateurs statistiques de présence et de mobilité des personnes sur le territoire, à destination de partenaires et de clients (français et étrangers) dans les domaines du tourisme, des transports, du géomarketing, etc. Ces indicateurs se basent sur l’analyse des données de localisation issues de la signalisation du réseau mobile.

L'objectif de ce stage est de contribuer au développement de ces algorithmes de génération de traces synthétiques en mettant en œuvre des méthodes d'apprentissage profond, d'analyse de séquences et de modélisation générative, et d'en implémenter des prototypes exploitables sur des études-test.

La première partie de ce stage sera consacrée à une étude approfondie de la littérature scientifique récente sur les modèles génératifs de traces de mobilité, avec un accent particulier sur les architectures basées sur les Transformers et les méthodes d'encodage de données spatio-temporelles pertinentes. Le stagiaire identifiera les architectures et les techniques d'encodage les plus prometteuses pour la modélisation de profils de mobilité long-terme.

Une seconde partie consistera à prototyper et évaluer ces architectures sur des jeux de données de mobilité réels anonymisés, afin de valider leur capacité à générer des traces synthétiques réalistes et cohérentes sur le long terme. Le stagiaire contribuera directement à la recherche de FluxVision sur la valorisation des données d'opérateur, en appliquant ces modèles à des cas d'usage concrets liés à la compréhension des dynamiques de mobilité.

Après une découverte de la solution Flux Vision et des techniques utilisées dans le domaine de l'analyse des données de mobilité (big data / modélisation mathématique), le stage se déroulera selon les étapes suivantes :

  • Prise en main des outils existants et des plateformes de données de mobilité.
  • Synthèse de la problématique des modèles génératifs de mobilité long-terme, proposition et conception d'architectures basées sur les Transformers.
  • Modélisation, entraînement et évaluation de modèles génératifs sur des données réelles anonymisées, prototypage et validation d'algorithmes.
  • Accompagnement dans l'équipe jusqu'à l'industrialisation potentielle et la mise en œuvre pour les cas d'usage de recherche de Flux Vision.
about you
  • De formation supérieure Bac +5 (Ecole d'ingénieur ou Université) en mathématiques appliquées, informatique, data science ou domaine similaire.
  • Bonne connaissance des problématiques et méthodes de machine learning/deep learning, en particulier des modèles génératifs (GANs, modèles de diffusion) et des architectures de type Transformer.
  • Maîtrise de l'environnement Python pour la data science (librairies comme PyTorch/TensorFlow, scikit-learn, pandas, numpy).
  • Facultés d'adaptation et d'excellentes qualités relationnelles et rédactionnelles (français et anglais).
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.