Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Chargé de projet recherche en apprentissage et traitement automatique des langues (H / F)

Agence nationale de sécurité sanitaire - Anses

Maisons-Alfort

Sur place

EUR 35 000 - 45 000

Plein temps

Il y a 24 jours

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une agence de santé publique recherche un Chargé de projet en apprentissage et traitement automatique des langues à Maisons-Alfort. Le candidat développera une méthode de reconnaissance d’entités basée sur des LLMs et collaborera avec des experts en microbiologie et sociologie. Un BAC +3 minimum et des compétences en Python et anglais scientifique sont requis. Ce poste offre une opportunité unique de travailler sur des projets innovants liés aux risques alimentaires.

Qualifications

  • Expérience similaire dans le traitement automatique des langues appréciée.
  • Capacité à travailler en mode projet, rigueur et organisation.
  • Connaissance des ontologies serait un plus.

Responsabilités

  • Développer une méthode de reconnaissance d’entités basées sur des LLMs.
  • Évaluer la méthode sur des jeux de données standard.
  • Détecter des entités sur un corpus non-annoté en français et en anglais.

Connaissances

Maîtrise des grands modèles de langue (LLMs)
Programmation Python
Évaluation de modèles
Anglais scientifique et technique
Recherche interdisciplinaire

Formation

BAC +3 minimum
Doctorat en Informatique ou TAL
Description du poste
L’Anses recrute

un Chargé de projet recherche en apprentissage et traitement automatique des langues (H / F)

Poste basé à Maisons-Alfort (94) - CDD de 12 mois

Vos missions

Vous participerez au projet de recherche SafeFood4ClimDiet coordonné par l’Anses, en collaboration avec l’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE). Ce projet a pour objectif d’identifier les risques microbiologiques associés aux nouvelles pratiques alimentaires influencées par le dérèglement climatique. Il vise en particulier à identifier les pratiques alimentaires par le développement de méthodes de traitement automatique des langues.

Vous aurez pour objectif de développer une méthode originale de reconnaissance d’entités nommées (NER) en français et en anglais, fonctionnant en zero‑shot learning, c’est‑à‑dire sans nécessiter de données d’entraînement annotées manuellement. L’approche envisagée est de s’appuyer sur les grands modèles de langue (LLMs) en mode conversationnel ("hard prompting"), tirant parti des connaissances latentes qu’ils ont acquises lors de leur pré‑entraînement sur de vastes corpus textuels. La méthode sera évaluée sur des jeux de données standard en reconnaissance d’entités (tels que NCBI Disease Corpus, FoodBase corpus), tout en étant optimisée pour identifier a minima deux types d’entités spécifiques : les concepts environnementaux (ex : "carbon footprint", "biodiversity loss", "environmental concern") et ceux en lien avec les comportements de consommation alimentaire (ex : noms d’aliments "apple", méthodes de production "organic food" ou encore relatives à des pratiques dites durables "composting food waste").

Votre équipe

À l’Anses, la Direction de l’évaluation des risques (DER) assure l’ensemble des missions d’évaluation dans le domaine des bénéfices et des risques nutritionnels et sanitaires liés à l’alimentation, des risques liés à la santé‑environnement, des risques liés à la santé au travail, des risques liés à la santé, à l’alimentation et au bien‑être des animaux, et des risques liés à la santé des végétaux. Au sein de cette direction, l’Unité « évaluation des risques liés aux aliments » (UERALIM) a pour mission principale la coordination des travaux de collectifs d’experts pour l’évaluation des risques sanitaires liés à la présence de contaminants biologiques ou chimiques dans les aliments, sous la responsabilité d’un chef d’unité et d’un adjoint. Elle contribue à la communication scientifique des produits de l’expertise et présente l’activité scientifique de l’unité auprès des instances nationales ou communautaires. Elle collabore avec les autres directions et les laboratoires de l’Agence. Elle participe à des projets de recherche nationaux ou internationaux. Vous rejoindrez une équipe de 15 personnes.

Le projet de recherche implique une collaboration avec l’unité de recherche MaIAGE (« Mathématiques et Informatique Appliquées du Génome à l’Environnement ») de l’INRAE, située à Jouy‑en‑Josas (78), qui développe des méthodes mathématiques et informatiques originales de portée générique ou motivées par des problèmes biologiques précis. L’équipe de recherche Bibliome développe des méthodes d’extraction d’information (text‑mining) à partir de textes, notamment dans les domaines des sciences du vivant (bioNLP).

Responsabilités
  • Développer une méthode originale de reconnaissance d’entités basée sur des LLMs, fonctionnant en zero‑shot learning
  • Mettre en place une évaluation rigoureuse en comparant la méthode aux approches de l’état de l’art sur des jeux de données standard de reconnaissance d’entités
  • Appliquer la méthode pour la détection des entités d’intérêt pour le projet, sur un corpus non‑annoté en français et en anglais, pour proposer des tendances alimentaires émergentes à d’autres acteurs du projet ANR. Le corpus sera composé de documents en science de la vie et en science sociale (publications scientifiques, articles de journaux)
  • Analyser le corpus du projet : annotation manuelle de quelques documents, mise en place d’une méthode baseline de reconnaissance d’entité à des fins de comparaison, et analyse d’erreurs
  • Collaborer avec les autres chercheurs du projet (informaticiens, microbiologistes et sociologues) et contribuer aux livrables scientifiques
Votre profil
Formation et expérience requises

BAC + 3 minimum

Doctorat en Informatique, en Traitement Automatique des Langues naturelles (TAL), Text‑mining ou discipline connexe souhaité.

Une première expérience similaire à l’une ou plusieurs des missions décrites sera appréciée.

Compétences
  • Maîtrise pratique des grands modèles de langue (LLMs) et utilisation par API
  • Maîtrise de la programmation Python
  • Expérience en évaluation de modèles
  • Capacité à travailler en mode projet, rigueur, organisation et planification
  • Maîtrise de l’anglais scientifique et technique (écrit et oral)
  • Expérience ou intérêt marqué pour la recherche interdisciplinaire, notamment avec les sciences du vivant (ex : sciences des aliments, microbiologie)
  • Connaissance des principes d’ingénierie des connaissances, et en particulier des ontologies, serait un plus

L’Anses recrute, accompagne et valorise les talents dans leur diversité pour s’engager au service de la santé publique.

Rejoignez‑nous !

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.