
Activez les alertes d’offres d’emploi par e-mail !
Générez un CV personnalisé en quelques minutes
Décrochez un entretien et gagnez plus. En savoir plus
Une institution de recherche à Montpellier propose un stage en génomique pour développer un pipeline prédisant les associations CREs/CRMs et l'expression génique. Le candidat idéal doit avoir une maîtrise de Python et de solides bases en machine learning/deep learning. Des connaissances en PyTorch, scikit-learn, et un intérêt pour la génomique sont souhaités. Le stage est basé à l’IRD-Occitanie et les candidatures doivent être envoyées par e-mail.
LLM Genomique GNN GRN Machine Learning TFBS CRE
Les éléments cis-régulateurs (CRE), courtes séquences d’ADN non codantes, interagissent avec les facteurs de transcription pour contrôler l’expression des gènes et généralement s’organisent en modules cis-régulateurs (CRM). Comprendre comment les CREs/CRMs contrôlent l’expression génique est un enjeu majeur pour la biologie végétale et la prédiction de phénotypes complexes. En 2025, un premier travail a permis d’évaluer plusieurs modèles de langage ADN (basés sur des LLM) pour la détection de TFBS/CREs dans les génomes d’Arabidopsis et du riz. Le stage 2026 propose d’aller plus loin : établir le lien entre CREs/CRMs, expression spatio-temporelle des gènes et structure des réseaux de régulation (GRN), en s’appuyant sur des modèles IA avancés.
Développer un pipeline reproductible permettant de prédire les associations CREs/CRMs→ expression chez Arabidopsis thaliana et Oryza sativa, et d’évaluer l’apport de différents modèles (ML classiques, LLM, GNN ) dans cette tâche. Le stage comprend plusieurs étapes :
Procédure : Envoyer un seul PDF (CV + lettre + relevé M1) à : firstname.lastname@ird.fr (Pierre Larmande) et (Mikael Lucas). Stage basé à l’IRD-Occitanie / UMD DIADE, Montpellier
Date limite : 21 janvier 2026
Offre publiée le 25 novembre 2025, affichage jusqu'au 21 janvier 2026