Activez les alertes d’offres d’emploi par e-mail !

Data Scientist (H/F)

INRAE

Dijon

Sur place

EUR 40 000 - 55 000

Plein temps

Il y a 2 jours
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Repartez de zéro ou importez un CV existant

Résumé du poste

Un institut de recherche reconnu, situé à Dijon, recherche un(e) expert(e) en ingénierie logicielle et data science pour développer des solutions innovantes d'extraction d'informations. Le candidat idéal doit maîtriser Python et R, et sera responsable de l'intégration de modèles d'apprentissage automatique dans des workflows automatisés. Offrant un environnement stimulant, ce poste donne accès à de nombreuses formations et avantages, incluant jusqu'à 30 jours de congés annuels, pour promouvoir un équilibre entre vie professionnelle et personnelle.

Prestations

30 jours de congés + 15 RTT
Soutien à la parentalité
Formation et développement des compétences
Garanties sociales et prêt social
Activités sportives et culturelles
Restauration collective

Qualifications

  • Formation recommandée : École d’ingénieur ou Master avec spécialisation en informatique et/ou data science.
  • Compétences indispensables en Python et R.
  • Capacité à développer des solutions d'extraction d'informations à partir de documents.

Responsabilités

  • Développer des solutions basées sur des systèmes experts et/ou des algorithmes de machine learning.
  • Mettre en œuvre des modèles d’extraction d’information à partir de documents.
  • Concevoir et déployer des pipelines ETL pour automatiser les flux de données.

Connaissances

Maîtrise de Python
Maîtrise de R
Expérience avec Docker
Compétences en OCR
Compétences en NLP
Expérience avec les SGBD

Formation

Master/Ingénieur (Bac+5)

Outils

Docker
Git
Kubernetes

Description du poste

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

Vous exercerez votre activité au sein de du pôle "Ingénierie logicielle, statistiques et sciences des données" de la plateforme ChemoSens, rattachée au Centre des Sciences du Goût et d’Alimentation (CSGA).

Le pôle, à taille humaine, est actuellement composé de trois membres aux profils complémentaires, alliant expertise en statistique, data science et ingénierie logicielle.

Vous évoluerez dans un environnement stimulant, à l’interface entre la recherche académique et les applications concrètes en sciences des données, avec un fort ancrage dans le domaine de l’alimentation.

Votre mission consistera à développer des solutions basées sur des systèmes experts et/ou des algorithmes de machine learning et de deep learning visant à extraire des informations sur des aliments (désignation commerciale / nom de l'aliment) à partir de différents supports (scan ou fichiers PDF de factures, photos d'aliments), puis à les apparier avec des référentiels d’aliments (Ciqual, OpenFoodFacts, FoodEx, etc.), afin d'automatiser (par exemple) le calcul d'indicateurs de qualité nutritionnelle et environnementale.

Ces modèles seront intégrés dans des pipelines ETL afin d’automatiser le workflow de traitement.

L’inférence et l’exploitation des résultats se feront via des interfaces développées en interne ; une contribution à ces aspects pourra être envisagée si le profil du candidat le permet.

Vous Serez Plus Particulièrement En Charge De

  • Mettre en œuvre des modèles d’extraction d’information à partir de documents (OCR, NLP, LLM, etc.).
  • Intégrer et consommer des API pour l’échange de données (récupération, envoi, mise à jour).
  • Concevoir et déployer des pipelines ETL pour automatiser les flux de données.
  • Déployer les modèles/algorithmes sous forme d’API sécurisées.
  • Conteneuriser les modèles/algorithmes dans des environnements Docker/Kubernetes.
  • Développer des interfaces front-end (Streamlit, Shiny, Angular ou autre) pour l’inférence et la visualisation des résultats.
  • Mettre en place des mécanismes de suivi de performance et de détection de dérive des modèles.

Formations et compétences recherchées

Master/Ingénieur (Bac+5)

Formation recommandée : Ecole d’ingénieur ou Master avec spécialisation en informatique et/ou data science.

  • Compétences indispensables :
  • Maîtrise de Python, R.
  • Une première expérience avec Docker, Git et Github.
  • Une première expérience avec les SGBD (SQL, No SQL).
  • Compétences appréciées :
  • Connaissances en JavaScript (Angular).
  • Initiation à Kubernetes.
  • Expérience appréciée :
  • Participation à un projet de traitement de données non structurées (ex : documents PDF, images, textes bruts, audio).
  • Mise en œuvre de modèles d'OCR, NLP, ou LLM pour l’extraction d’information.
  • Intégration de modèles ML/DL dans des pipelines de traitement (ETL, data pipelines).
  • Déploiement de modèles sous forme d’API, idéalement dans des environnements conteneurisés (Docker, Kubernetes).
  • Développement d’interfaces web (Angular, ou technologies équivalentes) permettant l’inférence ou la visualisation des résultats.
  • Sensibilité aux problématiques de monitoring, versioning et dérive des modèles.
  • Aptitudes recherchées :
  • Travail en équipe.
  • Rigueur.
  • Adaptabilité
  • Aptitude appréciée
  • Curiosité pour les recherches sur les comportements alimentaires.

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

  • jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
  • d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
  • de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
  • d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
  • de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
  • d'activités sportives et culturelles ;
  • d'une restauration collective.

Modalités pour postuler

Merci de transmettre une lettre de motivation et un CV.

Par E-mail

michel.visalli@inrae.fr

kipedene.coulibaly@inrae.fr

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.