Activez les alertes d’offres d’emploi par e-mail !

Data Scientist

INRAE Occitanie-Toulouse

Bourgogne-Franche-Comté

Sur place

EUR 35 000 - 50 000

Plein temps

Il y a 2 jours
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Repartez de zéro ou importez un CV existant

Résumé du poste

Un institut de recherche en Bourgogne-Franche-Comté recherche un ingénieur en développement pour travailler au sein de son pôle 'Ingénierie logicielle, statistiques et sciences des données'. Le candidat sera chargé de développer des solutions utilisant des algorithmes de machine learning et de deep learning pour l'extraction d'informations alimentaires. Une formation en informatique ou data science est requise, avec une maîtrise des outils comme Python et Docker. L'institut offre un cadre de travail riche en échanges scientifiques et des bénéfices attractifs.

Prestations

30 jours de congés + 15 RTT par an
Soutien à la parentalité
Développement des compétences
Activités sportives et culturelles
Restauration collective

Qualifications

  • Maîtrise de Python et R exigée.
  • Première expérience avec Docker, Git et les SGBD.
  • Expérience appréciée en OCR, NLP, ML/DL.

Responsabilités

  • Mettre en œuvre des modèles d'extraction d'information à partir de documents.
  • Concevoir et déployer des pipelines ETL pour automatiser les flux de données.
  • Développer des interfaces front-end pour l'inférence et la visualisation des résultats.

Connaissances

Python
R
Docker
Git
SQL
JavaScript

Formation

Master/Ingénieur (Bac+5)

Description du poste

Retour à la liste des résultats

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

Vous exercerez votre activité au sein de du pôle "Ingénierie logicielle, statistiques et sciences des données" de la plateforme ChemoSens, rattachée au Centre des Sciences du Goût et d’Alimentation (CSGA).

Le pôle, à taille humaine, est actuellement composé de trois membres aux profils complémentaires, alliant expertise en statistique, data science et ingénierie logicielle.

Vous évoluerez dans un environnement stimulant, à l’interface entre la recherche académique et les applications concrètes en sciences des données, avec un fort ancrage dans le domaine de l’alimentation.

Votre mission consistera à développer des solutions basées sur des systèmes experts et/ou des algorithmes de machine learning et de deep learning visant à extraire des informations sur des aliments (désignation commerciale / nom de l'aliment) à partir de différents supports (scan ou fichiers PDF de factures, photos d'aliments), puis à les apparier avec des référentiels d’aliments (Ciqual, OpenFoodFacts, FoodEx, etc.), afin d'automatiser (par exemple) le calcul d'indicateurs de qualité nutritionnelle et environnementale.

Ces modèles seront intégrés dans des pipelines ETL afin d’automatiser le workflow de traitement.

L’inférence et l’exploitation des résultats se feront via des interfaces développées en interne ; une contribution à ces aspects pourra être envisagée si le profil du candidat le permet.

Vous Serez Plus Particulièrement En Charge De

  • Mettre en œuvre des modèles d’extraction d’information à partir de documents (OCR, NLP, LLM, etc.).
  • Intégrer et consommer des API pour l’échange de données (récupération, envoi, mise à jour).
  • Concevoir et déployer des pipelines ETL pour automatiser les flux de données.
  • Déployer les modèles/algorithmes sous forme d’API sécurisées.
  • Conteneuriser les modèles/algorithmes dans des environnements Docker/Kubernetes.
  • Développer des interfaces front-end (Streamlit, Shiny, Angular ou autre) pour l’inférence et la visualisation des résultats.
  • Mettre en place des mécanismes de suivi de performance et de détection de dérive des modèles.

Formations et compétences recherchées

Master/Ingénieur (Bac+5)

Formation recommandée : Ecole d’ingénieur ou Master avec spécialisation en informatique et/ou data science.

  • Compétences indispensables :
  • Maîtrise de Python, R.
  • Une première expérience avec Docker, Git et Github.
  • Une première expérience avec les SGBD (SQL, No SQL).
  • Compétences appréciées :
  • Connaissances en JavaScript (Angular).
  • Initiation à Kubernetes.
  • Expérience appréciée :
  • Participation à un projet de traitement de données non structurées (ex : documents PDF, images, textes bruts, audio).
  • Mise en œuvre de modèles d'OCR, NLP, ou LLM pour l’extraction d’information.
  • Intégration de modèles ML/DL dans des pipelines de traitement (ETL, data pipelines).
  • Déploiement de modèles sous forme d’API, idéalement dans des environnements conteneurisés (Docker, Kubernetes).
  • Développement d’interfaces web (Angular, ou technologies équivalentes) permettant l’inférence ou la visualisation des résultats.
  • Sensibilité aux problématiques de monitoring, versioning et dérive des modèles.
  • Aptitudes recherchées :
  • Travail en équipe.
  • Rigueur.
  • Adaptabilité
  • Aptitude appréciée
  • Curiosité pour les recherches sur les comportements alimentaires.

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

  • jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
  • d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
  • de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
  • d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
  • de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
  • d'activités sportives et culturelles ;
  • d'une restauration collective.

Modalités pour postuler

Merci de transmettre une lettre de motivation et un CV.

Par E-mail

michel.visalli@inrae.fr

kipedene.coulibaly@inrae.fr

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr

Niveau hiérarchique
  • Niveau hiérarchique
    Premier emploi
Type d’emploi
  • Fonction
    Ingénierie et Technologies de l’information
Secteurs

Les recommandations augmentent vos chances d’obtenir un entretien chez INRAE Occitanie-Toulouse

Recevez des alertes en cas de nouvelles offres d’emploi: Scientifique des données , Bourgogne-Franche-Comté, France.

Responsable ingénierie de la Plateforme Universitaire de Données
Manuel Tester - Testeur Fonctionnel Manuel F/H
DÉVELOPPEUR ET CHEF DE PROJET DATA (H/F) - GROUPE GUILLIN - Ornans (25)
DÉVELOPPEUR ET CHEF DE PROJET DATA (H/F) - GROUPE GUILLIN - Ornans (25)
Ingénieur en développement et déploiement d’applications (F/H) - DSIN
Alternant(e) en développement d'application
DÉVELOPPEUR DE SERVICES D'INTÉGRATION ET D'API (iPaaS) (H/F) - GROUPE GUILLIN - Ornans (25)

Nous exploitons les connaissances de la communauté d’une toute nouvelle manière. Des experts ajoutent des informations directement à chaque article, élaboré à l’aide de l’intelligence artificielle.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.