Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

STAGE - Data Science Exploration d'applications d'embeddings géospatiaux - H/F

Groupe CLS

Ramonville-Saint-Agne

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 25 jours

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise en technologie géospatiale recherche un(e) stagiaire en Data Science pour travailler sur l'exploration d'applications d'embeddings géospatiaux. Le stagiaire conçoit un prototype d'exploration de données géospatiales, appuie sur des compétences en Machine Learning, Python, et autres outils de data science. Ce poste est idéal pour un(e) étudiant(e) en école d'ingénieurs ou Master 2, passionné(e) par l'Intelligence Artificielle.

Qualifications

  • Solides bases en apprentissage automatique et profond.
  • Maîtrise des langages et bibliothèques de data science.
  • Familiarité avec les environnements GPU et Cloud.

Responsabilités

  • Réaliser une étude bibliographique des modèles de fondation géospatiaux.
  • Cadrer des cas d’usage avec l’équipe Datalab.
  • Détecter des changements sémantiques dans les données.
  • Interroger des images EO par requêtes textuelles.
  • Préparer une base de données vectorielle d'embeddings.
  • Concevoir et implémenter un prototype.
  • Évaluer les performances et présenter les résultats.

Connaissances

Apprentissage automatique
Python
Machine Learning
Deep Learning
scikit-learn
PyTorch
pandas
numpy
geopandas
matplotlib
Git

Formation

Étudiant(e) en école d'ingénieurs ou en Master 2

Outils

Jupyter notebooks
AWS
Description du poste
Description

Dans ce contexte, l’équipe Data de CLS recherche un(e) stagiaire souhaitant mettre en pratique ses compétences sur le sujet suivant : "Exploration d’applications d'embeddings géospatiaux". Les modèles de fondation géospatiaux représentent une avancée majeure dans l’exploitation de données spatiales à grande échelle. Pré‑entraînés sur des données massives et souvent multi‑modales, ils permettent de créer des représentations riches et générales (les embeddings), de généraliser plus facilement sur différents territoires. Ces technologies visent à démocratiser l'utilisation des données d'Observation de la Terre (EO), rendant l'analyse avancée accessible sans expertise spécialisée en apprentissage automatique ou en SIG. L’objectif du stage est de concevoir un prototype d’exploration de données géospatiales en utilisant les embeddings, afin d’évaluer la maturité, les difficultés et les opportunités liées à cette nouvelle modalité dans les différentes métiers géospatiaux de CLS.

Responsabilités
  • Réaliser une étude bibliographique des approches des derniers modèles de fondation géospatiaux et des Vision Language Models, tels que SkyCLIP, RemoteCLIP, DescribeEarth, etc.
  • Cadrer des premiers cas d’usage avec l’équipe Datalab et les équipes métier de CLS.
  • La détection de changement sémantique : comparer les vecteurs dans le temps pour déterminer la nature du changement en langage naturel (par exemple, une forêt transformée en champ de culture).
  • L'interrogation d’images EO : permettre de rechercher des images satellites et leurs géolocalisations en utilisant des requêtes textuelles complexes.
  • La recherche de similarité : permettre de rechercher des images satellites ou de la recherche de similarité sémantique.
  • Préparer une base de données vectorielle d’embeddings sur une zone d’intérêt.
  • Préparer, à partir d’embeddings existants, une base de données vectorielle d’embeddings sur une zone d’intérêt.
  • Préparer, à partir d’embeddings qui seront générés sur une petite zone d’intérêt.
  • Concevoir, implémenter le prototype.
  • Avec le foundation model ou VLM approprié.
  • Avec la pipeline de bout en bout.
  • Avec une IHM simple (notebook, Gradio, Streamlit, etc.).
  • Évaluer les performances, limitations et axes d’améliorations.
  • Présenter et documenter les travaux au sein de l’équipe Data et aux équipes métier.
Profil recherché

Étudiant(e) en école d’ingénieurs ou en Master 2 avec une spécialisation en Data Science, Intelligence Artificielle, Machine Learning ou Mathématiques Appliquées, vous souhaitez mettre en application vos connaissances à travers des projets dans un domaine stimulant et porteur de sens.

Compétences et connaissances souhaitées
  • Solides bases en apprentissage automatique et profond (Machine Learning et Deep Learning)
  • Maîtrise des langages et bibliothèques de data science, en particulier Python, scikit‑learn, PyTorch, pandas, numpy, geopandas, matplotlib, etc.
  • Connaissance des outils de versionnement et de développement collaboratif (Git, Jupyter notebooks, etc.)
  • Une familiarité avec les environnements GPU, Cloud (notamment AWS) serait appréciée.
Qualités attendues
  • Curiosité scientifique et goût pour l’expérimentation
  • Esprit analytique, rigueur, sens de l’organisation et autonomie
  • Capacité à collaborer au sein d’équipes pluridisciplinaires
  • Bonnes capacités de communication écrite et orale pour présenter et valoriser vos résultats.
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.