
Activez les alertes d’offres d’emploi par e-mail !
Générez un CV personnalisé en quelques minutes
Décrochez un entretien et gagnez plus. En savoir plus
Une entreprise spécialisée en solutions d'observation de la Terre recherche un(e) stagiaire en Data Science pour explorer des applications d'embeddings géospatiaux. Les candidats doivent avoir une solide formation en apprentissage automatique et maîtriser Python. Les projets incluent l'étude de modèles géospatiaux et la conception de prototypes d'analyse de données. Le stage se déroule à Ramonville-Saint-Agne, en Occitanie.
Au cœur des enjeux de la planète, CLS, Tech4Good company, filiale du CNES et de la CNP, est une société à mission internationale, pionnière dans la fourniture de solutions d’observation et de surveillance de la Terre.
Opérateur historique des balises Argos, CLS, depuis 1986, avec plus de 1 100 collaborateurs répartis sur 31 sites dans le monde et un chiffre d’affaires annuel de près de 193 millions d’euros, figure parmi les spécialistes des services satellitaires en utilisant les technologies spatiales les plus avancées, couplées au génie logiciel et à la data‑sciences.
Vous souhaitez rejoindre des équipes agiles et dynamiques sur des projets innovants et ambitieux ? Explorer de nouvelles technologies ? Evoluer sur des projets transverses et variés autour des 5 secteurs d’activité de CLS ?
Dans ce contexte, l’équipe Data de CLS recherche un(e) stagiaire souhaitant mettre en pratique ses compétences sur le sujet suivant :
« Exploration d’applications d'embeddings géospatiaux . »
Les modèles de fondation géospatiaux représentent une avancée majeure dans l’exploitation de données spatiales à grande échelle. Pré‑entraînés sur des données massives et souvent multi‑modales, ils permettent de créer des représentations riches et générales (les embeddings), de généraliser plus facilement sur différents territoires.
Ces technologies visent à démocratiser l'utilisation des données d'Observation de la Terre (EO), rendant l'analyse avancée accessible sans expertise spécialisée en apprentissage automatique ou en SIG
L’objectif du stage est de concevoir un prototype d’exploration de donnée géospatiales en utilisant les embeddings, afin d’évaluer la maturité, les difficultés et ls opportunités liées à cette nouvelle modalité dans les différentes métiers géospatiaux de CLS.
Au cours de ce stage, vous serez amené(e) à :
A partir d’embeddings existants,
A partir d’embeddings qui seront générés sur une petite zone d’intérêt
Concevoir, implémenter le prototype
Avec le foundation model ou VLM approprié,
Avec la pipeline de bout en bout,
Avec une IHM simple (notebook, gradio, streamlit..)
Evaluer les performances, limitations et axes d’améliorations
Présenter et documenter vos travaux au sein de l’équipe Data et aux équipes métier.
Etudiant(e) en école d’ingénieurs ou en Master 2 avec une spécialisation en Data Science , Intelligence Artificielle , Machine Learning ou Mathématiques Appliquées , vous souhaitez mettre en application vos connaissances à travers des projets dans un domaine stimulant et porteur de sens.
Compétences et connaissances souhaitées :
Solides bases en apprentissage automatique et profond (Machine Learning et Deep Learning);
Maîtrise des langages et bibliothèques de data science, en particulier Python, scikit‑learn, PyTorch, pandas, numpy, geopandas, matplotlib, etc.
Connaissance des outils de versionnement et de développement collaboratif (Git, Jupyter notebooks, etc.),
Une familiarité avec les environnements GPU, Cloud (notamment AWS) serait appréciée.
Qualités attendues :
Curiosité scientifique et goût pour l’expérimentation
Esprit analytique, rigueur, sens de l’organisation et autonomie
Capacité à collaborer au sein d’équipes pluridisciplinaires
Bonnes capacités de communication écrite et orale pour présenter et valoriser vos résultats.