Activez les alertes d’offres d’emploi par e-mail !

Data Scientist - LLM (F/H)

JR France

Rhône

Sur place

EUR 40 000 - 55 000

Plein temps

Il y a 3 jours
Soyez parmi les premiers à postuler

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Le Centre Léon Bérard recherche un Data Scientist pour renforcer sa Data Factory. Ce poste de 18 mois contribue à la structuration des données d'anatomopathologie et à la mise en place d'algorithmes utilisant l'intelligence artificielle. Vous travaillerez avec des équipes multidisciplinaires pour développer des solutions de structuration de données pertinentes pour la recherche clinique en oncologie.

Prestations

25 RTT par an
Mutuelle familiale sans surcoût
Crèche d'entreprise
Salle de sport accessible
Plan vélo

Qualifications

  • Diplômé d'un Master en Data Science ou dans un domaine connexe.
  • Maîtrise des techniques de NLP et des modèles génératifs.
  • Bonne compréhension des modèles de structuration d'informations.

Responsabilités

  • Développement et implémentation d'algorithmes de structuration pour les données d'anatomopathologie.
  • Optimisation des modèles de traitement automatique du langage.
  • Validation et évaluation des performances des modèles.

Connaissances

Traitement du langage naturel
Modèles génératifs
Pseudonymisation
Gestion de données sensibles

Formation

Master en Data Science
Informatique
Mathématiques appliquées

Outils

Python
spaCy
Transformers
SQL
Pandas
Git

Description du poste

Le Centre Léon Bérard (#CLB ), membre de la fédération Unicancer, est LE pôle de référence régional en cancérologie. Regroupant 2.300 collaborateurs sur un site unique à Lyon 8ème, nous sommes à la fois un hôpital et un centre de recherche.

Nous assurons 3 missions essentielles :

  • Le soin : nos équipes soignantes prennent en charge plus de 42.000 patients par an, avec des soins personnalisés et innovants
  • La recherche : nos chercheurs et médecins travaillent main dans la main, couvrant les domaines de la recherche fondamentale, translationnelle et clinique
  • L’enseignement : chaque année, nous assurons la diffusion des savoirs et formons nos collaborateurs et des professionnels extérieurs

Dans le cadre d'une création de poste , nous souhaitons renforcer notre Data Factory en recrutant : Data Scientist - Structuration des données d'anatomopathologie (F/H) - CDD de 18 mois, évolutif - temps plein - pour contribuer à la structuration de données issues de comptes-rendus d'anatomopathologie. Ce projet, porté par le Health Data Hub et soutenu par Bpifrance, rassemble une trentaine de partenaires dans le but de développer des outils d'intelligence artificielle générative pour la santé.

Votre travail s'inscrira dans un cas d'usage stratégique du projet visant à améliorer la structuration automatique des données médicales pour favoriser la recherche clinique, en particulier en oncologie. Vous collaborerez avec des experts en traitement automatique du langage (TAL) et en modélisation IA afin de concevoir des solutions robustes et innovantes adaptées aux spécificités des données médicales.

  • Développement et implémentation d'algorithmes de structuration pour les données issues des comptes-rendus d'anatomopathologie, en intégrant des techniques avancées de NLP et d'IA générative.
  • Optimisation des modèles de traitement automatique du langage pour adapter les grands modèles de langage (LLM) aux spécificités du domaine médical, en coordination avec les chercheurs en TAL du consortium.
  • Validation et évaluation des performances des modèles pour garantir leur pertinence clinique et assurer leur conformité aux exigences de fiabilité et d'interprétabilité.
  • Collaboration étroite avec des équipes multidisciplinaires (médecins, chercheurs en IA, spécialistes en santé publique) pour adapter les outils développés aux besoins des praticiens et aux particularités des données d'anatomopathologie.
  • Participation à la mise en place de standards de pseudonymisation et de sécurisation des données, pour assurer un usage secondaire conforme aux régulations.

PROFIL ET COMPETENCES :

Diplômé d'un Master en Data Science, Informatique, Mathématiques appliquées ou dans un domaine connexe.

- Compétences techniques :

  • Maîtrise des techniques de traitement du langage naturel (NLP) et des modèles génératifs.
  • Bonne compréhension des modèles de structuration et d'extraction d'informations.
  • Connaissance des principes de pseudonymisation et de la gestion de données sensibles.
  • Langages et outils : Python, bibliothèques NLP (spaCy, Transformers, etc.), outils de gestion de données (SQL, Pandas), et outils de versionnage (Git).

- Qualités personnelles :

Capacité à travailler en équipe dans un environnement multidisciplinaire.

Faites LA DIFFÉRENCE, en choisissant un TRAVAIL DIFFÉRENT !

Nous rejoindre, c’est :

  • Accomplir un travail qui compte et où chacun compte.
  • Vivre au quotidien des expériences enrichissantes.
  • Travailler avec plaisir au sein d’une communauté à l’ambiance conviviale.
  • Construire votre parcours et grandir dans une structure apprenante.
  • Concilier « vivre et travailler ».

Au Centre Léon Bérard, nous vous proposons :

  • En moyenne, 25 RTT par an (en plus de 5 semaines de congés payés).
  • La possibilité d’alimenter un Compte Epargne Temps (CET).
  • Une carrière évolutive avec un accompagnement et des formations adaptés.
  • Une mutuelle qui couvre l’ensemble de la famille, y compris le (la) conjoint(e), sans surcoût.
  • Une crèche d’entreprise, un self, un comité d’entreprise de proximité, un accès à notre salle de sport, un plan vélo, etc.

Dans le cadre de sa politique diversité, le Centre Léon Bérard étudie toutes les candidatures dont celles de personnes en situation de handicap.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.