Activez les alertes d’offres d’emploi par e-mail !
Une entreprise technologique recherche un stagiaire en bio-informatique à Vélizy-Villacoublay. Les responsabilités incluent l'analyse et l'implémentation de pipelines bio-informatiques. Les candidats doivent être en Master 2 avec une expertise en programmation Python/R et des connaissances en données omiques. Un cadre de travail convivial, axé sur l'innovation et la diversité, est proposé.
L'organisation "Virtual Twin of Human Technology" de Dassault Systèmes est une équipe pluridisciplinaire dans des domaines technologiques, biologiques et biomédicaux de l'entreprise. Elle réalise une veille scientifique et technologique permanente ainsi que des prototypes logiciels pour évaluer l'applicabilité des nouvelles technologies et/ou des connaissances scientifiques pour une nouvelle dimension de la santé humaine.
Par exemple, dans un but de prévention, la modélisation virtuelle et sa simulation vont devenir un élément clé pour les médecins qui peuvent transformer des informations très complexes en actes médiaux pratiques.
Les pratiques cliniques actuelles reposent de plus en plus sur des données « omiques », telles que les données de séquençage, provenant de l'hôte et parfois du microbiote. La variabilité entre cohortes, en plus de l'hétérogénéité des patients, rend la compréhension de toute structure cachée dans ces données difficile à interpréter. Pour permettre la stratification des patients et leur diagnostic, il est alors essentiel de développer de nouvelles méthodes d'apprentissage statistique robustes face à l'hétérogénéité des données, efficaces sur le plan computationnel, et compréhensibles par des experts humains.
Dans cette optique, l'implémentation de pipelines bio-informatiques standardisés joue un rôle clé, permettant l'automatisation, la traçabilité et la reproductibilité des traitements appliqués aux données brutes (post-séquençage par exemple). En harmonisant les étapes d'analyse, du prétraitement à l'extraction de caractéristiques, ils permettent de comparer les études, d'intégrer les données de différentes cohortes et de fournir une base fiable pour l'application de modèles d'Intelligence Artificielle.
Dans ce contexte, vos principaux objectifs de stage seront les suivants :
[1] MEGAHIT: an ultra-fast single-node solution for large and complex metagenomics assembly via succinct de Bruijn graph (DOI: https://doi.org/10.1093/bioinformatics/btv033)
[2] CD-HIT: accelerated for clustering the next-generation sequencing data (DOI: https://doi.org/10.1093/bioinformatics/bts565)
[3] Nextflow enables reproducible computational workflows (DOI: https://doi.org/10.1038/nbt.3820)
Actuellement en Master 2 / Bac+5 en Ecole d'ingénieur ou Université, avec une spécialisation en BioInformatique, Computational Biology ou Biologie des Systèmes.
Vous avez des connaissances dans les domaines suivants :
De nature rigoureuse et autonome, vous savez travailler en équipe et contribuer efficacement à la réussite collective. Vous êtes force de proposition et savez faire preuve de pédagogie dans la présentation et l'explication des résultats du stage.
Vous avez un niveau d'anglais suffisant pour pouvoir comprendre et analyser la documentation technique écrite en anglais.
Une première expérience en développement de pipeline serait un vrai plus.
Intégrer une entreprise scientifique au cœur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans
Déclaration de diversité
Dassault Systèmes, avant-gardiste en matière de technologie et d'innovation durable, s'efforce de créer des équipes toujours plus inclusives et diverses à travers le monde. Nous avons la forte conviction que nos employés sont notre atout numéro 1 et nous voulons que tous, se sentent libres d'être pleinement qui ils sont vraiment. Notre objectif est qu'ils ressentent fierté et sentiment d'appartenance. En tant qu'entreprise à la pointe du changement, il nous incombe de favoriser l'inclusion de tous et participer à création du monde de demain.