Activez les alertes d’offres d’emploi par e-mail !

Transcriptomique spatiale : sélection de variables et réduction de dimensions

SFBI

Paris

Sur place

EUR 40 000 - 60 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Résumé du poste

Un institut de recherche biomédicale à Paris cherche un stagiaire en bioinformatique pour un projet sur la transcriptomique spatiale. Le candidat idéal a une maîtrise du langage R, des connaissances en apprentissage statistique, et est autonome dans l'environnement Unix. Le stage commence entre janvier et mars 2026, avec des missions visant à améliorer la reproductibilité des analyses de données. Envoyez votre candidature à l'adresse fournie.

Qualifications

  • Connaissances en apprentissage statistique et en analyses de données omiques.
  • Maîtrise du langage de programmation R.
  • Autonomie dans l'environnement Unix.
  • Notions de développement logiciel seraient un plus.

Responsabilités

  • Participer au développement de méthodes pour la reproductibilité du clustering.
  • Améliorer la qualité des résultats d'analyses de transcriptomique spatiale.
  • Accéder à des jeux de données Visium issus de contextes physiopathologiques.

Connaissances

Apprentissage statistique
Analyse de données omiques
Langage de programmation R
Environnement Unix
Développement logiciel

Formation

Master de bioinformatique, biostatistiques ou école d’ingénieur
Description du poste
Transcriptomique spatiale : sélection de variables et réduction de dimensions

Stage·Stage M2·6 moisBac+5 / MasterInstitut Cochin·Paris 14 (France)taux légal

Date de prise de poste : 5 janvier 2026

transcriptomique spatiale clustering sélection de variables réduction de dimensions reproductibilité performance

L’Institut Cochin est un centre de recherche biomédicale multithématique, réunissant 42 équipes de recherche et 10 plateformes technologiques. L’équipe « From Gametes to Birth » de l’Institut Cochin s’intéresse à la biologie de la reproduction, couvrant la production et la fusion des gamètes, les interactions entre le fœtus et la mère et les conséquences à long terme d’une grossesse.

La technologie 10x Genomics Visium permet la localisation précise de transcrits sur une coupe de tissu biologique. Du point de vue de l’analyse de données, cette technologie de transcriptomique spatiale permettant la quantification de l’expression de gènes à l’échelle du génome complet s’apparente au séquençage en cellule unique (single-cell RNA-seq).

Le clustering, qui consiste à rassembler des localisations de la coupe de tissu ayant des profils transcriptomiques similaires, est l’une des analyses couramment réalisées avec ce type de données. Elle est constituée de plusieurs étapes : normalisation des données brutes, sélection de variables, réduction de dimensions du jeu de données, intégration de données issues de plusieurs échantillons, avant le clustering à proprement parler. Pour chacune d’entre elles, des paramètres peuvent grandement affecter la qualité finale du clustering final.

Les méthodes développées pour l’analyse de données de single-cell RNA-seq ont été initialement appliquées aux données de transcriptomique spatiale. Malgré la profusion récente de méthodes spécialement développées pour tirer profit de l’information spatiale de ces données, les méthodes développées pour l’analyse de données de single-cell RNA-seq restent largement utilisées pour analyser des données de transcriptomique spatiale. De plus, le choix de paramètres pour chacune des étapes menant au clustering est très rarement discuté.

Au sein de l’équipe « From Gametes to Birth », l’étudiant(e) prendra part au développement d’une méthode visant à atteindre une reproductibilité non arbitraire du clustering de données de transcriptomique spatiale, tout en améliorant la qualité des résultats. Dans cette optique, une attention particulière sera portée aux étapes de sélection de variables et de réduction de dimensions en tirant profit de l’information spatiale des données. L’étudiant(e) aura accès à des jeux de données Visium issus de trois contextes physiopathologiques différents (membranes fœtales lors de l’accouchement et coupes de cerveau dans des contextes de prééclampsie et de méningite bactérienne). De plus, l’étudiant(e) évaluera la performance des différentes approches méthodologiques explorées à l’aide de jeux de données simulées et de jeux de données publiques.

Etudiant(e) en Master de bioinformatique, biostatistiques ou en école d’ingénieur.

Compétences
  • Connaissances en apprentissage statistique et en analyses de données omiques.
  • Maîtrise du langage de programmation R et autonomie dans l’environnement Unix.
  • Notions de développement logiciel seraient un plus
Début du stage

Le stage pourra commencer entre le 05/01/2026 et le 02/03/2025 en fonction des exigences de la formation de l’étudiant(e).

Pour candidater, merci d’envoyer à christophe.le-priol@inserm.fr

  • Un CV (1 page)
  • Une lettre de motivation détaillant les intérêts pour ce stage (1 page)

Procédure : Envoyer un mail à christophe.le-priol@inserm.fr

Offre publiée le 6 octobre 2025, affichage jusqu'au 28 novembre 2025

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.