Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

STAGE - Reconstruction de courants par Deep Learning - H/F

Groupe CLS

Ramonville-Saint-Agne

Sur place

EUR 40 000 - 60 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise spécialisée en data science et AI en Occitanie recherche un(e) stagiaire pour développer des modèles de Deep Learning afin de fusionner des données denses et clairsemées. Le candidat idéal est étudiant(e) en ingénierie ou Master 2 spécialisé en Data Science, avec une solide maîtrise des langages et bibliothèques appropriés. Ce stage implique des travaux pratiques importants et un cadre collaboratif.

Qualifications

  • Solides bases en apprentissage automatique et profond.
  • Maîtrise des langages et bibliothèques de data science.
  • Connaissance des outils de versionnement et développement collaboratif.
  • Familiarité avec les environnements Cloud appréciée.
  • Expérience en analyse de données massives un plus.

Responsabilités

  • Réaliser une revue bibliographique des approches existantes.
  • Concevoir et développer un modèle de Deep Learning dans Pytorch.
  • Comparer et évaluer les performances des approches proposées.
  • Présenter et valoriser vos travaux auprès de l’équipe Data.

Connaissances

Apprentissage automatique et profond
Python
scikit-learn
PyTorch
pandas
numpy
matplotlib
Git
Jupyter notebooks
Cloud (AWS)

Formation

Étudiant(e) en ingénierie ou Master 2 en Data Science
Description du poste
Description

Les courants océaniques de surface résultent de la combinaison complexe de différents processus physiques et leur compréhension est essentielle pour diverses applications (régulation du climat, dynamique des écosystèmes marins, navigation, dispersion des polluants). Les modèles de Deep Learning actuels dédiés à la reconstruction des courants de surface en Méditerranée et/ou l'Atlantique Nord, intègrent des données océanographiques (température, salinité, hauteur de mer), de vent, et autres données grillées. Les résultats sont très encourageants, mais peuvent néanmoins être améliorés en intégrant des données in‑situ, issues de bouées dérivantes ou radars HF, qui apportent des informations locales précieuses.

L’objectif est de développer des architectures complexes de Deep Learning (combinant CNN, LSTM, Transformers, mécanismes d’attention) capables de fusionner efficacement des données denses (comme les données océanographiques issues de modèles numériques), ainsi que des données in‑situ clairsemées (bouées dérivantes, radars HF). Ces dernières aideraient à représenter des phénomènes complexes, comme les oscillations quasi‑inertielles qui restent incorrectement reconstruites dans notre solution.

Au cours de ce stage, vous serez amené(e) à :
  • Réaliser une revue bibliographique des approches existantes état de l’art, de modèles multimodaux de Deep Learning intégrant données denses et clairsemées.
  • Concevoir et développer un modèle de Deep Learning dans le framework Pytorch, avec une architecture innovante combinant CNN, LSTM, Transformers, mécanismes d’attention.
  • Comparer et évaluer les performances des approches proposées face aux modèles internes de référence existants (modèles Unet et ConvLSTM).
  • Présenter, documenter, et valoriser vos travaux auprès de l’équipe Data et des autres pôles techniques de CLS, ainsi que lors des journées des stages en IA en juin / juillet.

Profil recherché

Etudiant(e) en école d’ingénieurs ou en Master 2 avec une spécialisation en Data Science, Intelligence Artificielle, Machine Learning ou Mathématiques Appliquées, vous souhaitez mettre en application vos connaissances à travers des projets porteurs de sens, contribuant à la gestion durable des océans.

Compétences et connaissances souhaitées :
  • Solides bases en apprentissage automatique et profond (Machine Learning et Deep Learning).
  • Maîtrise des langages et bibliothèques de data science, en particulier Python, scikit‑learn, PyTorch (ou TensorFlow), pandas, numpy, matplotlib, etc.
  • Connaissance des outils de versionnement et de développement collaboratif (Git, Jupyter notebooks, etc.).
  • Une familiarité avec les environnements Cloud (notamment AWS) serait appréciée.
  • Une première expérience en analyse de données massives et/ou en apprentissage automatique serait également un plus.
ualités attendues:
  • Curiosité scientifique et goût pour l’expérimentation.
  • Esprit analytique, rigueur, sens de l’organisation et autonomie.
  • Capacité à collaborer au sein d’équipes pluridisciplinaires.
  • Bonnes capacités de communication écrite et orale pour présenter et valoriser vos résultats.
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.