Dassault Systèmes
CNRS
Ministère de l'enseignement supérieur et de la recherche
CNRS
Syndicat des Internes des Hôpitaux de Paris
Institut Mines-Télécom
Ministère de l'enseignement supérieur et de la recherche
Syndicat des Internes des Hôpitaux de Paris
Dassault Systèmes
University of Lille 1 Sciences and Technology
La Taverne Laval
CENTRE PEDIATRIQUE DES COTES
CNRS
Agx Informatique
Agx Informatique
LA TABLE DU SCION
MUSÉUM D'ORLÉANS POUR LA BIODIVE...
ACTUAL KOUROU 666
HUTCHINSON CENTRE DE RECHERCHE
CNRS MOY400 ILE-DE-FRANCE GIF-SUR-YVETTE
UNIVERSITE GRENOBLE ALPES
INRAE GRAND-EST-COLMAR COLMAR
COLLEGE LES SEPT ARPENTS
Une entreprise innovante en technologie recherche un stagiaire pour appliquer des méthodes de machine learning sur des données longitudinales afin de stratifier des patients. Le candidat idéal sera en Master 2 en biostatistiques et maîtrisera Python et R. Ce stage offre un cadre convivial axé sur le bien-être, dans un environnement multiculturel.
Sujet : Méthodes statistiques et de Machine Learning pour le clustering intégrant des données longitudinales
Au sein du département Corporate Strategy & Research, vous intégrerez l'équipe « Living Twins for Practitioners », riche de compétences en médecine, biologie, mathématique et informatique, et qui conduit plusieurs projets en oncologie, neurologie et cardiologie.
Dans le cadre de la diversification de nos activités en santé, vous ferez partie de l'équipe « Clinical Decision » et serez responsable de la mise en place de méthodes statistiques ou de Machine Learning permettant d'identifier les patients les plus proches d'un individu index (stratification) à l'aide de méthodes de clustering sur la base de données de patients longitudinales (i.e., variant dans le temps), et de comparer ces patients similaires avec les autres populations, pour en déduire une carte de connaissance de la maladie étudiée ainsi qu'une analyse approfondie des trajectoires de la maladie dans le temps.
Le but de ce stage sera de mettre en place et de comparer des méthodes de statistiques et de Machine Learning permettant de stratifier des patients atteints d'une maladie dont l'occurrence reste limitée et dont les mécanismes sous-jacents de la maladie restent à approfondir. Les patients seront stratifiés selon leurs caractéristiques cliniques et biologiques dont la mesure est temporelle en utilisant des méthodes de clustering adaptées pour la gestion de données longitudinales [Lu, 2024].
Un exemple d'application pourrait être le syndrome de Dravet qui est une épilepsie grave de l'enfant, d'origine génétique, qui débute avant l'âge d'un an par des crises convulsives. Le syndrome de Dravet se manifeste principalement par des crises d'épilepsie et un retard de développement et/ou des troubles de l'apprentissage qui se développent dans la toute petite enfance et qui s'intensifient avec le temps, et évoluent vers un déficit intellectuel.
Dans le cadre des maladies infantiles rares, l'évolution durant les premiers mois et années est d'une importance cruciale, mais mettre en œuvre des méthodologies dans ce contexte reste très ambitieux. Il s'agira donc de tester les méthodologies implémentées sur des maladies plus fréquentes (en oncologie par exemple) puis tester leur généralisation à des maladies plus rares. L'enjeu technique de ces travaux réside dans la prise en compte de données longitudinales pour la création de clusters de patients (dépendances des observations mesurées dans le temps, données manquantes, non linéarité des trajectoires, etc.).
[Lu, 2024] Lu, Z. (2024). Clustering longitudinal data: A review of methods and software packages. International Statistical Review.
Actuellement en Master 2 / Bac+5 en Ecole d'ingénieur ou Université, avec une spécialisation en Biostatistiques, Statistiques ou Mathématiques Appliquées.
Vous possédez :
De nature rigoureuse et autonome, vous aimez travailler en équipe et contribuer à des projets collectifs. Vous faites preuve d'esprit critique, d'initiative et disposez d'un bon sens de la communication.
Vous êtes à l'aise pour communiquer en anglais dans un contexte international, à l'oral comme à l'écrit.
Des connaissances en biologie et/ou en médecine seraient un plus.
Intégrer une entreprise scientifique au cœur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans
Principaux avantages et bénéfices :
Dassault Systèmes, avant-gardiste en matière de technologie et d'innovation durable, s'efforce de créer des équipes toujours plus inclusives et diverses à travers le monde. Nous avons la forte conviction que nos employés sont notre atout numéro 1 et nous voulons que tous, se sentent libres d'être pleinement qui ils sont vraiment. Notre objectif est qu'ils ressentent fierté et sentiment d'appartenance. En tant qu'entreprise à la pointe du changement, il nous incombe de favoriser l'inclusion de tous et participer à création du monde de demain.
* The salary benchmark is based on the target salaries of market leaders in their relevant sectors. It is intended to serve as a guide to help Premium Members assess open positions and to help in salary negotiations. The salary benchmark is not provided directly by the company, which could be significantly higher or lower.