Activez les alertes d’offres d’emploi par e-mail !

Ingénieur de recherche Intelligence artificielle et sémantique

INRAE

Castanet-Tolosan

Sur place

EUR 40 000 - 55 000

Plein temps

Il y a 4 jours
Soyez parmi les premiers à postuler

Résumé du poste

Un organisme de recherche en France recherche un ingénieur de recherche en intelligence artificielle et sémantique. Le candidat devra avoir une maîtrise de Python et des bases de données, et sera impliqué dans des projets autour de l'analyse et de la gestion de données textuelles. Le poste offre également des avantages comme des jours de congés étendus et un environnement de travail flexible.

Prestations

Jusqu'à 30 jours de congés + 15 RTT par an
Soutien à la parentalité
Développement des compétences
Accompagnement social

Qualifications

  • Formation recommandée : Master/Ingénieur avec spécialisation en informatique et/ou data science.
  • Compétences Indispensables à avoir.

Responsabilités

  • Vous contribuerez à des projets en gestion et analyse des données textuelles.
  • Concevoir et déployer des pipelines ETL pour automatiser les flux de données.
  • Mettre en œuvre des modèles d'extraction d'informations.

Connaissances

Maîtrise de Python
Bases de données (SQL, No SQL)
Une première expérience avec Docker

Formation

Master/Ingénieur (Bac+5)

Outils

Docker
Gitlab

Description du poste

Présentation

INRAE, Institut national de recherche pour l’agriculture, l’alimentation et l’environnement, est un organisme public de recherche qui réunit 12 000 collaborateurs au sein de 272 unités réparties sur 18 centres en France. Premier organisme mondial spécialisé sur l’ensemble agriculture – alimentation – environnement, INRAE joue un rôle clé pour accompagner les transitions nécessaires face aux grands défis planétaires.

Face à l’augmentation de la population, aux enjeux de sécurité alimentaire, au changement climatique, à la raréfaction des ressources et au déclin de la biodiversité, INRAE s’engage à développer des solutions scientifiques et à accompagner l’évolution des pratiques agricoles, alimentaires et environnementales.

Contexte et équipe

Le poste est rattaché à Direction pour la Science Ouverte (DipSO), une direction placée sous la responsabilité du Directeur général délégué Science et Innovation. La DipSO développe une offre de services, produit des études et des prototypes, conseille/forme les acteurs de la science et de la stratégie en matière de science ouverte et de numérique pour la science. Elle rassemble, pour ce faire, des compétences diverses, complémentaires (documentation, informatique, scientifique, data science) pour assurer ses services et gérer des projets sur l’ensemble de son périmètre. Elle est organisée en quatre pôles.

Son pôle Numérique pour la Science (Num4Sci) contribue à consolider la politique de l’établissement en matière de numérique scientifique, en assurant la mise à disposition d’outils et de services pour la science ouverte. Ces outils et services communs visent notamment à favoriser une pratique plus ouverte et collaborative de la science, et à permettre aux communautés scientifiques de profiter davantage des opportunités du numérique.

Votre mission

Vous serez accueilli(e) au sein de l’équipe Données et Sémantique (D&S) du pôle Num4Sci de la DipSO. Vous contribuez à l’évolution des services en matière de gestion et d’analyse des données textuelles, qu’elles soient structurées ou non. Vous contribuerez à des projets dans ce domaine en étant force de proposition sur les technologies, outils et méthodes à utiliser. Vous assurerez une veille technologique, et contribuerez à la montée en compétences de vos collègues. Vous évoluerez dans un environnement stimulant, à l’interface entre la recherche académique et les applications concrètes en sciences des données.

Votre mission consistera à conduire et mettre en œuvre des projets de développement de solutions applicatives (Python) basées sur des algorithmes de machine learning ou de deep learning visant à extraire des informations sur des productions scientifiques (publications, jeux de données) à partir de différents supports (fichiers PDF, jeux de métadonnées), et à les aligner avec des référentiels (structures, individus, thématiques, mots clés...) afin, par exemple,

Vous Serez Plus Particulièrement En Charge De

  • Mettre en œuvre des modèles d’extraction d’informations à partir de documents (NLP, LLM, etc.).
  • Intégrer et consommer des API pour l’échange de données.
  • Concevoir et déployer des pipelines ETL pour automatiser les flux de données.
  • Conteneuriser les modèles/algorithmes dans des environnements Docker/Kubernetes.
  • Mettre en place des mécanismes de suivi de performance et de détection de dérive des modèles.

Modalités pour postuler

Transmettre Une Lettre De Motivation Et Un CV En Précisant L’objet Du Mail « Candidature Au Poste D’ingénieur De Recherche Intelligence Artificielle Et Sémantique »

Les candidats retenus seront auditionnés la semaine du 22 septembre (entretien d’une heure maximum en visio ou présentiel). Ils recevront un mail d’invitation à l’entretien 1 semaine à l’avance. Les candidats non convoqués au-delà de cette période pourront considérer leur candidature infructueuse.

Formations et compétences recherchées

Master/Ingénieur (Bac+5)

Formation recommandée : Master/Ingénieur (Bac+5) — École d’ingénieur ou Master avec spécialisation en informatique et/ou data science.

Compétences et connaissances

Compétences Indispensables

  • Maîtrise de Python, et librairies associées
  • Bases de données (SQL, No SQL), Graph, Vectorielles …
  • Une première expérience avec Docker, Gitlab.

Connaissances Souhaitées

  • Traitement des données textuelles et modèles de langue
  • Sémantique, vocabulaires contrôlés et ontologies (RDF, SKOS, OWL)
  • Méthodes et outils de gestion de projets
  • IA : machine learning, deep learning, LLMs, embeddings
  • Langages documentaires (ex : thésaurus)
  • Initiation à Kubernetes.

Expérience Appréciée

  • Participation à un projet de traitement de données non structurées (ex : documents PDF, images, textes bruts...).
  • Mise en œuvre de modèles, NLP, ou LLM pour l’extraction d’information.
  • Intégration de modèles ML/DL dans des pipelines de traitement (ETL, data pipelines).
  • Déploiement de modèles sous forme d’API, idéalement dans des environnements conteneurisés (Docker, Kubernetes).
  • Sensibilité aux problématiques de monitoring, versioning et dérive des modèles.

Aptitudes Recherchées

  • Travail en équipe.
  • Rigueur.
  • Adaptabilité
Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

  • jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
  • d'un soutien à la parentalité : CESU garde d’enfants, prestations pour les loisirs ;
  • de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
  • d’un accompagnement social : conseil et écoute, aides et prêts sociaux ;
  • de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
  • d activites sportives et culturelles ;
  • d une restauration collective.
Modalités pour postuler

J envoie mon CV et ma lettre de motivation

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.