Activez les alertes d’offres d’emploi par e-mail !

Post-doctorant(e) (H/F): Apprentissage non supervisé de politiques de manipulation d'objets pou[...]

CNRS

Aubière

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 7 jours

Soyez parmi les premiers à postuler

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Le CNRS recherche un(e) post-doctorant(e) pour un projet en apprentissage non supervisé de politiques de manipulation d'objets. Le candidat(e) sera impliqué(e) dans le développement de stratégies d'apprentissage et travaillera sur des environnements robotiques. Cette position, située à Aubière, nécessite un doctorat en rapport avec des compétences en apprentissage automatique.

Qualifications

Solide expérience et publications dans le domaine de l'apprentissage automatique.
Expérience souhaitée en apprentissage actif, motivations intrinsèques.
Capacité à interagir de manière fluide avec différents membres du consortium.

Responsabilités

Proposer des stratégies et architectures d'apprentissage de politique.
Évaluer ces stratégies en utilisant un environnement robotique 3D.
Rédiger des articles scientifiques et coordonner avec d'autres partenaires.

Connaissances

Apprentissage automatique

Apprentissage profond

Apprentissage par renforcement

Interaxion fluide avec les membres du consortium

Autonomie

Proactivité

Expérience avec des simulateurs de robotique 3D

Formation

Doctorat dans un domaine pertinent

Post-doctorant(e) (H/F): Apprentissage non supervisé de politiques de manipulation d'objets pour l'apprentissage efficace de représentations sensorimotrices, Aubière

Informations générales

Intitulé de l'offre : Post-doctorant(e) (H/F) : Apprentissage non supervisé de politiques de manipulation d'objets pour l'apprentissage efficace de représentations sensorimotrices
Référence : UMR6602-CELTEU-001
Nombre de Postes : 1
Lieu de travail : AUBIERE
Date de publication : vendredi 6 juin 2025
Type de contrat : Chercheur en contrat CDD
Durée du contrat : 18 mois
Date d'embauche prévue : 1 octobre 2025
Quotité de travail : Complet
Rémunération : à partir de 2991€ bruts mensuels selon expérience
Niveau d'études souhaité : Doctorat
Expérience souhaitée : Indifférent
Section(s) CN : 07 - Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues

Une première partie du projet MeSMRise se concentrera sur l'apprentissage de représentations (multimodales) et de graphes d'interactions structurés par des actions. Alors que des politiques d'action aléatoires ou naïves peuvent être utilisées pour cela, des manipulations dirigées devraient être plus efficaces pour l'apprentissage de représentations d'objets.
Le/la candidat(e) se concentrera donc sur l'apprentissage de politiques d'action et abordera les principales questions suivantes : - Comment apprendre de manière non supervisée à sélectionner des actions qui conduiront à de meilleures représentations ? Nous considérerons le cadre de l'apprentissage de la manipulation active d'objets et explorerons l'utilisation d'impulsions intrinsèques dérivées des pertes SSL pour apprendre des politiques de manipulation. - Comment apprendre des politiques hiérarchiques pour la manipulation d'objets en utilisant les pertes SSL comme moteurs d'apprentissage actif ? Nous étudierons l'impact de l'accès à ces différents niveaux d'actions dans un cas de politique hiérarchique - Comment exploiter les graphes d'anticipations appris pour guider l'apprentissage de politiques efficaces ? Nous étudierons également comment exploiter au mieux les informations d'inférence fournies par les anticipations apprises d'autres WP pour guider davantage l'apprentissage de l'agent. En effet, les représentations abstraites (par exemple, les primitives sensorimotrices) et les inférences de plus haut niveau dans les environnements non markoviens peuvent être utilisées pour une planification optimale des actions (par exemple, en utilisant l'algorithme de recherche heuristique informée D*), des augmentations de structure (par exemple, pour lier plusieurs petites rotations comme une manipulation à plus grande échelle d'un seul objet). Ceci peut être utilisé pour sélectionner le meilleur plan d'action, afin d'optimiser l'exploitation (par exemple pour la distinguabilité) ou l'exploration (par exemple en biaisant les mécanismes de curiosité). Enfin, le/la candidat'e) devra contribuer à la coordination avec les autres tâches et partenaires du projet.

Activités

- Proposer différentes stratégies et architectures d'apprentissage de politique
- Évaluer ces stratégies en utilisant un environnement robotique 3D simulant la manipulation d'objets 3D
- Rédiger des articles scientifiques
- Coordonner avec les autres partenaires du projet et contribuer à l'intégration.

Compétences

Le/la candidat(e) idéal(e) est titulaire d'un doctorat dans un domaine pertinent et a :
- une solide expérience et des publications dans le domaine de l'apprentissage automatique, en particulier l'apprentissage profond et l'apprentissage par renforcement pour la manipulation et la perception d'objets.
- Une expérience de l'apprentissage actif, des motivations intrinsèques et/ou de l'apprentissage auto-supervisé est fortement souhaitée.
- Expérience avec des simulateurs de robotique 3D
- Capacité à interagir de manière fluide avec les différents membres du consortium ;
- Autonomie et proactivité dans les activités de recherche et les rapports d'activité

Contexte de travail

Ce poste postdoctoral s'inscrit dans le projet ANR MeSMRise (Multimodal deep SensoriMotor Representation learning) (https:///mesmrise/.
Le projet MeSMRise propose de s'inspirer de la façon dont les bébés humains apprennent à explorer leur environnement à travers des actions qui façonnent leur expérience multimodale. Inspiré par la théorie des contingences sensorimotrices (SMC), l'objectif principal du projet est d'étudier comment l'action peut structurer les représentations multimodales, apprises avec des méthodes d'apprentissage auto-supervisé (SSL). Ceci sera appliqué à des objets 3D, perçus par vision et nuage de points, et manipulés dans des environnements virtuels.
Ce post-doctorat s'inscrit dans le troisième workpackage du projet relatif à l'apprentissage actif, se concentrant sur l'apprentissage de politiques d'action qui permettent un apprentissage efficace des représentations d'objets.
Le/la candidat(e) travaillera à l'Institut Pascal, à proximité de Clermont-Ferrand, et interagira avec d'autres partenaires du projet à Lyon et à Grenoble.

Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.

Obtenez votre examen gratuit et confidentiel de votre CV.

ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.

Noté « Excellent » sur la base de 16 491 évaluations