Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Stage Data Scientist NLP

codoc

Paris

Sur place

EUR 100 000 - 125 000

Temps partiel

Il y a 25 jours

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise du secteur technologique à Paris recherche un stagiaire Data Scientist pour optimiser des algorithmes de recherche et participer à l'enrichissement des thésaurus dans le cadre du projet Meditwin. Le candidat idéal possède des compétences en machine learning et en biochemistry, et travaillera sur des méthodes d'analyse sémantique avancées. Ce stage offre une occasion unique de contribuer à des projets nationaux innovants.

Qualifications

  • Connaissances en machine learning et biochemie.
  • Expérience en recherche et développement sera un atout.
  • Capacité à travailler sur des outils d'analyse sémantique.

Responsabilités

  • Assurer l'enrichissement des thésaurus pour optimiser l'extraction d'informations.
  • Tester des méthodes d'extraction d'informations dans des comptes rendus hospitaliers.
  • Proposer et tester de nouvelles méthodes pour améliorer les algorithmes.

Connaissances

Laboratory Experience
Immunoassays
Machine Learning
Biochemistry
Assays
Research Experience
Spectroscopy
Research & Development
cGMP
Cell Culture
Molecular Biology
Data Analysis Skills
Description du poste

codoc recherche dun stagiaire Data Scientist dans léquipe R&D. Tu participeras à loptimisation des algorithmes de recherche développés en partenariat avec lInstitut Imagineet à leur intégration dans des projets nationaux tels queMeditwin.

Dans le cadre du projet Meditwin codoc contribue au développement doutils danalyse sémantique avancés pour lidentification automatique de patients à risque de maladies rares.

Tes missions :

Standardisation sémantique : Tu assureras lenrichissement des thésaurus pour optimiser les méthodes dextraction dinformations cliniques dans le texte. Tu veilleras à lalignement des entités extraites avec des terminologies médicales standardisées (notamment UMLS) afin de faciliter la comparaison sémantique entre patients. Cet alignement multilingue sera utilisé pour exécuter lalgorithme de similarité développé par codoc afin didentifier les patients les plus proches au sens clinique.

Test et comparaison de méthodes NLP : Tu seras chargé dappliquer les méthodes dextraction dinformations pertinentes à partir de comptes rendus hospitaliers multilingues pour sassurer de la performance de lenrichissement des thesaurus.

Optimisation des algorithmes de R&D : Tu proposeras et testeras de nouvelles méthodes visant à améliorer les performances des algorithmes notamment celui utilisé pour identifier les patients atteints de maladies rares.

Key Skills
  • Laboratory Experience
  • Immunoassays
  • Machine Learning
  • Biochemistry
  • Assays
  • Research Experience
  • Spectroscopy
  • Research & Development
  • cGMP
  • Cell Culture
  • Molecular Biology
  • Data Analysis Skills

Employment Type : Intern

Experience : years

Vacancy : 1

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.