Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Ingénieur en traitement automatique du langage (TAL) 100% ETP - Centre de Données Cliniques (H/F)

Pole Emploi

Angers

Sur place

EUR 20 000 - 40 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Un centre hospitalier à Angers recherche un ingénieur en traitement automatique du langage pour développer des méthodes d'analyse de données textuelles. Les candidats doivent avoir un Bac+5 ou un PhD en Data Science, une expérience en NLP et des compétences en Python. Ce poste propose 39 heures par semaine, un CDD d'un an et des modalités de travail flexibles incluant du télétravail.

Prestations

39h/semaine
28 jours de congés annuels
20 jours de RTT
1 jour de télétravail possible / semaine

Qualifications

  • Expérience confirmée en NLP appliqué à des données métier.
  • Capacité à passer du besoin métier à la mise en production d'un modèle.
  • Capacité à travailler en équipe et à gérer un projet.

Responsabilités

  • Développer et mettre en œuvre des méthodes d'analyse pour exploiter le langage naturel.
  • Extraction et qualification de concepts à partir de textes.
  • Évaluation et benchmark des modèles de traitement du langage.

Connaissances

Langage Python
Data engineering léger
Outils NLP
MLOps basique
DataViz
Connaissance des ontologies médicales

Formation

Bac+5 / PhD en Data Science, Informatique, TAL

Outils

SQL
Hugging Face
spaCy
Plotly
Matplotlib
Description du poste
Contexte

00H/semaine

[74533] Centre Hospitalier Universitaire d'Angers

Situé au cœur de la ville d'Angers et du Campus santé, le CHU d'Angers met en œuvre et exploite un entrepôt de données de santé. En charge de l'exploitation de cet entrepôt, le CDC a pour objectifs de contribuer à l'amélioration des soins par l'analyse et la réutilisation des données médicales et leur mise à disposition des chercheurs cliniciens dans un cadre sécurisé et dans le respect de la réglementation. Le CDC intervient sur des projets de recherche régionaux et nationaux.

Pour le développement de cette activité, le Département Sciences de la Donnée de la Direction de la Recherche et Innovation du CHU d'Angers (DRI) recrute un ingénieur en traitement automatique du langage (TAL).

Missions et activités

Développer et mettre en œuvre des méthodes d'analyse et de modélisation pour exploiter le langage naturel et les données textuelles issues des comptes rendus (CR) et bases structurées, dans le but d'en extraire des concepts, et automatiser la compréhension des documents.

  • Extraction et qualification de concepts à partir de textes et données structurées (ex. pathologies, traitements, observations).
  • Enrichissement sémantique des données via des graphes de connaissances, lexiques métiers, embeddings ou ontologies médicales.
  • Classification automatique de documents (machine learning, deep learning, LLM) selon des typologies définies.
  • Préparation, nettoyage et annotation de corpus pour entraîner des modèles NLP (NER, text classification, relation extraction).
  • Évaluation et benchmark des modèles (Hugging Face, spaCy, modèles propriétaires, etc.).
  • Data visualization et restitution claire des résultats auprès des équipes métier et recherche.
  • Contribution aux études complexes mêlant texte, données structurées et raisonnement statistique.
Description du profil recherché
Compétences requises
  • Langage : Python (Pandas, Scikit-learn, PyTorch, Transformers, spaCy, NLTK).
  • Data engineering léger : SQL, manipulation de données textuelles volumineuses.
  • Outils NLP : Hugging Face, spaCy, fastText, embeddings (Word2Vec, BERT, etc.).
  • MLOps basique : MLflow, Streamlit, API REST pour servir des modèles (souhaité).
  • DataViz : Plotly, Matplotlib, ou équivalent.
  • Connaissance des ontologies médicales ou terminologies métier (SNOMED, UMLS) (souhaité).
AUTRES INFORMATIONS SUR LE POSTE

Profil recherché

Formation Bac+5 / PhD en Data Science, Informatique, TAL ou domaine équivalent.

Expérience confirmée (ou stage solide) en NLP appliqué à des données métier.

Capacité à passer du besoin métier à la mise en production d'un modèle.

Capacité à travailler en équipe, à gérer la mise en œuvre d'un projet et sa documentation technique.

Curiosité, rigueur scientifique, sens de la communication.

Temps de travail
39h/semaine, 28j de congés annuels, 20 jours de RTT, 1 jour de télétravail possible / semaine

Contrat
CDD d'un an renouvelable

Rémunération : selon grilles de la fonction publique hospitalière (en fonction du diplôme et de l'expérience)

Pour postuler, merci de déposer votre CV et lettre de motivation sur la plateforme Mstaff.

Horaires : Horaires normaux

Période de la journée : Jour

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.