Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Modélisation de l’espace latent pour les modèles de Deep Learning utilisés en segmentation d’in[...]

Laboratoire National de Métrologie et d'Essais - LNE

Île-de-France

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 30+ jours

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une organisation de recherche en métrologie recherche un(e) stagiaire pour travailler sur l'évaluation des incertitudes en apprentissage automatique. Le candidat devra maîtriser Python et avoir des connaissances en PyTorch. Les missions incluent la modélisation, l'implémentation de méthodes et la rédaction d'un rapport scientifique. Ce stage pourrait donner lieu à une thèse.

Qualifications

  • Curiosité scientifique et goût pour le travail en équipe.
  • Maîtrise du langage de programmation Python est essentielle.
  • Connaissance des librairies couramment utilisées dans le domaine du Deep Learning.

Responsabilités

  • Étude bibliographique des méthodes pour modéliser l'espace de représentation latent.
  • Sélection et implémentation des différentes méthodes.
  • Génération de nouveaux échantillons et évaluation de modèles de segmentation.
  • Rédaction d'un rapport scientifique synthétisant les résultats.
  • Fournir les codes Python développés.

Connaissances

Curiosité scientifique
Travail en équipe
Maîtrise de Python
Connaissance de PyTorch

Formation

Étudiant(e) en M2 ou dernière année d'école d'ingénieur

Outils

PyTorch
Description du poste

Description

Contexte du stage :

Des travaux de recherche sont menés depuis plusieurs années au sein du département Science des Données et Incertitudes sur l’évaluation des incertitudes associées aux prédictions des algorithmes d’apprentissage. Une thèse portant sur deux sources d’incertitude (incertitude prédictive induite par l’incertitude des entrées et incertitude dite de répétabilité correspondant à l’incertitude liée au réentraînement du même réseau) a été soutenue fin .

À présent, nos efforts se portent sur l’incertitude du jeu de données d’entraînement et plus spécifiquement l’incertitude d’échantillonnage afin de cadrer notamment le domaine de validité des modèles d\'apprentissage profond. Dans la littérature scientifique actuelle, le recours à la géométrie différentielle pour représenter les données et l\'utilisation de modèles génératifs (VAEs, GANs, modèles de Diffusion, modèles basés sur les flux, etc.) sont prédominants. À titre d\'exemple, Chadebec et Allassonnière proposent un échantillonnage par HMC (Hamiltonian Monte Carlo) de la distribution uniforme dérivée intrinsèquement de l’espace latent riemannien appris par un VAE comme nouvelle approche d\'augmentation de données. Les travaux de Wu et Pan, quant à eux, suggèrent d\'utiliser un modèle de mélange Gaussien comme prior dans l’espace latent du VAE. Ces contributions récentes témoignent de l’importance de repenser la modélisation latente comme un espace structuré, où la géométrie peut jouer un rôle central dans la définition du domaine de validité et la quantification de l\'incertitude d\'échantillonnage notamment.

Pour se faire, le(a) stagiaire identifiera les approches les plus pertinentes de l’état de l’art pour modéliser l’espace de représentation latent et implémentera les méthodes sélectionnées afin de réaliser une première comparaison numérique. L’application industrielle attachée à ces développements est la segmentation d’instances de particules à partir de mesures en microscopie électronique à balayage.

Missions :

Intégré(e) au sein du département Science des Données et Incertitudes, les développements à réaliser au cours de ce stage s’articulent de la manière suivante :

  • Étude bibliographique des méthodes à l’état de l’art pour modéliser l’espace de représentation latent des données d’entraînement adaptée aux tâches de segmentation d’instances
  • Sélection et implémentation des différentes méthodes
  • Génération de nouveaux échantillons à partir des différentes approches et évaluation de la robustesse des modèles de segmentation d’instances utilisés en interne
  • Rédiger un rapport scientifique synthétisant vos résultats
  • Fournir les codes Python développés

Profile

Étudiant(e) en M2 ou en dernière année d\'école d\'ingénieur, spécialisé(e) en mathématiques ou statistiques appliquées.

Doté(e) d\'une forte curiosité scientifique et d’un goût pour le travail en équipe, vous souhaitez mettre en œuvre et enrichir vos compétences en apprentissage automatique.

La maîtrise du langage de programmation Python est essentielle et la connaissance de PyTorch et des librairies couramment utilisées dans le domaine du Deep Learning est évidemment souhaitée.

Ce stage pourra donner lieu à une thèse.

Starting date

02-02

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.