Activez les alertes d’offres d’emploi par e-mail !
Une institution académique en France recherche un doctorant pour un projet portant sur l'association génome-environnement et le décalage génomique. Le candidat doit avoir un Master II en Statistique ou Machine Learning et des compétences en programmation avancée en Python et/ou R. Il rejoindra un consortium de chercheurs pour développer des méthodologies innovantes appliquées à des données génomiques. Avantages incluent la participation à des projets interdisciplinaires.
Université Paris-Saclay GS Mathématiques
L'objectif de cette thèse est de développer des approches statistiques pour l'analyse des études d'association Génome-Environnement (GEA) et de Décalage Génomique (Genomic Offset, GO) en s'appuyant sur les développements récents en optimisation et en inférence statistique. Plus précisément, le/la doctorant(e) recruté(e) développera des approches d'inférence variationnelle et d'optimisation stochastique pour la GEA afin d'accélérer l'inférence, afin de pouvoir analyser des jeux de données génomiques de grande taille modernes pouvant concerner des centaines de populations. Il/elle développera également des modèles probabilistes de GO inspirés de l'approche d’Analyse de Redondance et l'étendra en la combinant à des réseaux de neurones afin de traiter les relations non linéaires entre covariables et variables de réponse. À cette fin, le/la doctorant(e) rejoindra un consortium de chercheurs issus de différentes disciplines et bénéficiant d'une longue expérience en projets interdisciplinaires. La méthodologie développée sera appliquée à des jeux de données publics à des fins d'analyse comparative, ainsi qu'à un ensemble innovant de deux jeux de données correspondant à une plante domestique (le maïs) et à son ancêtre sauvage (la téosinte). La comparaison entre les deux espèces permettra d'étudier comment l'adaptation des espèces sauvages apparentées aux cultures aux environnements secs pourrait être informative sur la réponse du maïs à un climat plus extrême.
The goal of the PhD project is to contribute to the development of innovative Genome-Environment Association (GEA) and Genomic Offset (GO) procedures that will build on recent advances in optimization and statistical inference. More specifically the recruited PhD student will consider variational inference approaches for GEA and stochastic optimization to speed up the inference, with the objective of scaling up to modern genomic datasets that may involve hundreds of populations. He/she will also develop probabilistic GO models inspired from the Redundancy Analysis approach and extend it by introducing Neural Networks in order to handle non-linear relationships between covariates and response variables. To this aim, the PhD student will join a consortium of researchers issued from different disciplines with a long experience in interdisciplinary projects. The developed methodology will be applied to public datasets for benchmarking purposes, as well as, to an innovative set of two datasets corresponding to a domestic plant (maize) and its wild “ancestor” (teosinte). This will enable us to investigate how adaptation of crop wild relatives to dry environments could be informative about the response of maize to a drier climate.
Début de la thèse : 01/10/2025
WEB : https://mia-ps.inrae.fr/sites/default/files/2025-05/PhD%20Position%20Genomic%20offset_offer.pdf
Funding category: Autre financement public
ANR*Autre type de financement
Etudiant(e) titulaire d'un Master II en Statistique / Machine Learning
Compétences approfondies de programmation en R ou Python
Une première expérience d'analyse de données génomiques ou en biostatistique est recommandée.
Compétences complémentaires Forte appétence pour le travail multidisciplinaire et en équipe.
Les exigences suivantes:
Number of offers available 1
Company/Institute Université Paris-Saclay GS Mathématiques
Country France
City Palaiseau cedex
The goal of the PhD project is to contribute to the development of innovative Genome-Environment Association (GEA) and Genomic Offset (GO) procedures that will build on recent advances in optimization and statistical inference. More specifically the recruited PhD student will consider variational inference approaches for GEA and stochastic optimization to speed up the inference, with the objective of scaling up to modern genomic datasets that may involve hundreds of populations. He/she will also develop probabilistic GO models inspired from the Redundancy Analysis approach and extend it by introducing Neural Networks in order to handle non-linear relationships between covariates and response variables. To this aim, the PhD student will join a consortium of researchers issued from different disciplines with a long experience in interdisciplinary projects. The developed methodology will be applied to public datasets for benchmarking purposes, as well as, to an innovative set of two datasets corresponding to a domestic plant (maize) and its wild “ancestor” (teosinte). This will enable us to investigate how adaptation of crop wild relatives to dry environments could be informative about the response of maize to a drier climate.
Starting date: 01/10/2025
WEB : https://mia-ps.inrae.fr/sites/default/files/2025-05/PhD%20Position%20Genomic%20offset_offer.pdf
Funding category: Other public funding
ANR*Other type of funding
Student holding a Master II in Statistics / Machine Learning
Strong programming skills in Python and/or R
Prior experience in genomic data analysis or biostatistics is desirable but not essential.
A strong interest in biological applications and ability to work in a multidisciplinary team
Number of offers available 1
Company/Institute Université Paris-Saclay GS Mathématiques
Country France
City Palaiseau cedex