Activez les alertes d’offres d’emploi par e-mail !

Approches statistiques pour l'étude et la prédiction la vulnérabilité génomique des populations[...]

Université Paris-Saclay GS Mathématiques

France

Sur place

EUR 20 000 - 40 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Résumé du poste

Une institution académique en France recherche un doctorant pour un projet portant sur l'association génome-environnement et le décalage génomique. Le candidat doit avoir un Master II en Statistique ou Machine Learning et des compétences en programmation avancée en Python et/ou R. Il rejoindra un consortium de chercheurs pour développer des méthodologies innovantes appliquées à des données génomiques. Avantages incluent la participation à des projets interdisciplinaires.

Qualifications

  • Diplôme de Master II en Statistique ou Machine Learning exigé.
  • Compétences avancées en programmation en Python et/ou R nécessaires.
  • Une expérience en biostatistique et analyse de données génomiques est recommandée.

Responsabilités

  • Développer des approches d'inférence variationnelle et d'optimisation stochastique pour la GEA.
  • Créer des modèles probabilistes de GO et les améliorer avec des réseaux de neurones.
  • Travailler en consortium avec des chercheurs de différentes disciplines.

Connaissances

Compétences de programmation avancées en Python
Compétences de programmation approfondies en R
Analyse de données génomiques
Travail multidisciplinaire

Formation

Master II en Statistique / Machine Learning
Description du poste
French – Description

Université Paris-Saclay GS Mathématiques

L'objectif de cette thèse est de développer des approches statistiques pour l'analyse des études d'association Génome-Environnement (GEA) et de Décalage Génomique (Genomic Offset, GO) en s'appuyant sur les développements récents en optimisation et en inférence statistique. Plus précisément, le/la doctorant(e) recruté(e) développera des approches d'inférence variationnelle et d'optimisation stochastique pour la GEA afin d'accélérer l'inférence, afin de pouvoir analyser des jeux de données génomiques de grande taille modernes pouvant concerner des centaines de populations. Il/elle développera également des modèles probabilistes de GO inspirés de l'approche d’Analyse de Redondance et l'étendra en la combinant à des réseaux de neurones afin de traiter les relations non linéaires entre covariables et variables de réponse. À cette fin, le/la doctorant(e) rejoindra un consortium de chercheurs issus de différentes disciplines et bénéficiant d'une longue expérience en projets interdisciplinaires. La méthodologie développée sera appliquée à des jeux de données publics à des fins d'analyse comparative, ainsi qu'à un ensemble innovant de deux jeux de données correspondant à une plante domestique (le maïs) et à son ancêtre sauvage (la téosinte). La comparaison entre les deux espèces permettra d'étudier comment l'adaptation des espèces sauvages apparentées aux cultures aux environnements secs pourrait être informative sur la réponse du maïs à un climat plus extrême.

The goal of the PhD project is to contribute to the development of innovative Genome-Environment Association (GEA) and Genomic Offset (GO) procedures that will build on recent advances in optimization and statistical inference. More specifically the recruited PhD student will consider variational inference approaches for GEA and stochastic optimization to speed up the inference, with the objective of scaling up to modern genomic datasets that may involve hundreds of populations. He/she will also develop probabilistic GO models inspired from the Redundancy Analysis approach and extend it by introducing Neural Networks in order to handle non-linear relationships between covariates and response variables. To this aim, the PhD student will join a consortium of researchers issued from different disciplines with a long experience in interdisciplinary projects. The developed methodology will be applied to public datasets for benchmarking purposes, as well as, to an innovative set of two datasets corresponding to a domestic plant (maize) and its wild “ancestor” (teosinte). This will enable us to investigate how adaptation of crop wild relatives to dry environments could be informative about the response of maize to a drier climate.

Début de la thèse : 01/10/2025

WEB : https://mia-ps.inrae.fr/sites/default/files/2025-05/PhD%20Position%20Genomic%20offset_offer.pdf

Funding category: Autre financement public

ANR*Autre type de financement

French – Prérequis et exigences

Etudiant(e) titulaire d'un Master II en Statistique / Machine Learning

Compétences approfondies de programmation en R ou Python

Une première expérience d'analyse de données génomiques ou en biostatistique est recommandée.

Compétences complémentaires Forte appétence pour le travail multidisciplinaire et en équipe.

Les exigences suivantes:

  • A Master's degree in Applied Mathematics / Statistics / Machine Learning
  • Advanced programming skills in Python and/or R
  • Prior experience in biostatistics and genomic data analysis is desirable but not essential
  • A strong interest in applications in biology and ability to work in a multidisciplinary team

Number of offers available 1

Company/Institute Université Paris-Saclay GS Mathématiques

Country France

City Palaiseau cedex

English – Description

The goal of the PhD project is to contribute to the development of innovative Genome-Environment Association (GEA) and Genomic Offset (GO) procedures that will build on recent advances in optimization and statistical inference. More specifically the recruited PhD student will consider variational inference approaches for GEA and stochastic optimization to speed up the inference, with the objective of scaling up to modern genomic datasets that may involve hundreds of populations. He/she will also develop probabilistic GO models inspired from the Redundancy Analysis approach and extend it by introducing Neural Networks in order to handle non-linear relationships between covariates and response variables. To this aim, the PhD student will join a consortium of researchers issued from different disciplines with a long experience in interdisciplinary projects. The developed methodology will be applied to public datasets for benchmarking purposes, as well as, to an innovative set of two datasets corresponding to a domestic plant (maize) and its wild “ancestor” (teosinte). This will enable us to investigate how adaptation of crop wild relatives to dry environments could be informative about the response of maize to a drier climate.

Starting date: 01/10/2025

WEB : https://mia-ps.inrae.fr/sites/default/files/2025-05/PhD%20Position%20Genomic%20offset_offer.pdf

Funding category: Other public funding

ANR*Other type of funding

English – Requirements

Student holding a Master II in Statistics / Machine Learning

Strong programming skills in Python and/or R

Prior experience in genomic data analysis or biostatistics is desirable but not essential.

A strong interest in biological applications and ability to work in a multidisciplinary team

Number of offers available 1

Company/Institute Université Paris-Saclay GS Mathématiques

Country France

City Palaiseau cedex

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.