Activez les alertes d’offres d’emploi par e-mail !

Utilisation LLMs pour la spécification des politiques de partage des données - CDD - Paris-Sacl[...]

CEA

Palaiseau

Sur place

EUR 48 000 - 58 000

Plein temps

Il y a 5 jours
Soyez parmi les premiers à postuler

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Rejoignez le CEA en tant qu'Ingénieur(e) pour contribuer aux projets de recherche en utilisant des LLMs pour la spécification des politiques de partage des données. Ce poste de cadre offre des défis techniques passionnants en collaboration avec une équipe de recherche. Vous participerez à la conception et à la mise en œuvre de solutions innovantes, tout en bénéficiant d'un environnement de travail dynamique et d'un équilibre vie professionnelle/vie personnelle.

Prestations

Télétravail possible
Équilibre vie privée / vie professionnelle
Formations pour le développement des compétences
Accès à un CE riche en avantages
Écosystème de recherche à la pointe

Qualifications

  • Doctorat ou Master requis dans un domaine technique.
  • Compétences en NLP et en LLMs nécessaires.
  • Expérience dans la rédaction de spécifications techniques.

Responsabilités

  • Formaliser des idées en rédigeant des spécifications.
  • Utiliser des LLM pour modéliser les politiques de partage de données.
  • Gérer et analyser des données d'entraînement pour des LLM.

Connaissances

Analyse
Utilisation des LLMs
NLP
Modélisation
Rédaction technique

Formation

Doctorat en informatique
Master en mathématiques
Master en ingénierie des systèmes

Description du poste

Utilisation LLMs pour la spécification des politiques de partage des données - CDD - Paris-Saclay F/H, Palaiseau

Description de l'offre

Rejoignez le CEA pour donner du sens à votre activité, mener et soutenir des projets de R&D nationaux et internationaux, cultiver et faire vivre votre esprit de curiosité.

Le CEA recherche un(e) Ingénieur(e) en usage des LLMs pour la spécification des politiques de partage des données pour la CEA / DRT (Direction de la Recherche Technologique). Ce poste de cadre en CDD de 36 mois est basé sur le site Nano-Innov de Paris-Saclay, Essonne (91).

Il s'agit d'un poste à pourvoir dès que possible.

Le développement de systèmes physiques ou numériques est complexe et implique des défis techniques et humains. La première étape consiste à formaliser les idées en rédigeant des spécifications ou un cahier des charges, généralement rédigés en langage naturel par des analystes fonctionnels. Ces documents sont cruciaux pour le projet et facilitent la communication entre les parties prenantes. L'ingénierie des exigences propose des techniques (revues, modélisation, formalisation) pour améliorer la qualité des documents (cohérence, complétude) et corriger les défauts avant l’implémentation du système.

Les réseaux de neurones à grands modèles (LLM) apportent de nouvelles possibilités dans ce domaine. Nous proposons d’utiliser un agent conversationnel (ChatGPT, Lama) pour modéliser les politiques de partage de données (ODRL) à partir de texte naturel. L’outil recommandera des options de réécriture inspirées des normes INCOSE et EARS, analysera les résultats et fournira un audit sur la qualité du modèle obtenu.

Les LLM sont particulièrement prometteurs pour :

  • Transformer les exigences non structurées en modèles structurés comme EARS ou des user stories.
  • Classer les exigences : comportementale, non fonctionnelles, etc., comme défini dans [4].
  • Signaler les ambiguïtés, incohérences ou violations potentielles sur la base d'heuristiques de validation prédéfinies.

Cependant, les LLM présentent des limites : hallucinations, biais algorithmiques et généralisation limitée. Pour pallier cela, nous suggérons d’hybrider les LLM avec d’autres techniques (NLP, algèbres de processus) afin de réduire ces impacts.

Au sein de l’équipe « Exigences intelligentes » du laboratoire, votre challenge consistera à :

  • Déterminer des schémas ou un langage contrôlé pour représenter le modèle ODRL.
  • Évaluer l’efficacité de différentes techniques et formalismes, tel que le NLP ou l’inspiration de la métrique Bleu, pour éviter les hallucinations lors de la réécriture.
  • Analyser, gérer ou générer des données d’entraînement pour des LLM.
  • Configurer et piloter un ou plusieurs LLM avec les techniques les plus efficaces pour améliorer la cohérence et la complétude des politiques de partage de données.
  • Développer l’outillage logiciel nécessaire aux travaux ci-dessus.

Profil du candidat

  • Titulaires d'un doctorat ou d'un Master en informatique, en mathématiques ou en ingénierie des systèmes.

Les aspects complémentaires de votre mission peuvent aussi nous intéresser :

  • Un écosystème de recherche à la pointe dédié à des thématiques à fort enjeu sociétal.
  • Des formations pour renforcer vos compétences et en acquérir de nouvelles.
  • Un équilibre vie privée / vie professionnelle reconnu par nos collaborateurs.
  • La possibilité de télétravailler.
  • Un CE riche en avantages et activités sociales, culturelles et sportives.
  • Un lieu de travail au cœur d’un plateau dynamique.

Cela vous tente ? Postulez, ce poste est fait pour vous !

Conformément aux engagements du CEA en faveur de l'intégration des personnes en situation de handicap, cet emploi est ouvert à toutes et à tous.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.