Activez les alertes d’offres d’emploi par e-mail !

Post-doctorat en Génération Automatique de Textes à base H/F

CNRS

Grand Est

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 2 jours
Soyez parmi les premiers à postuler

Résumé du poste

Un centre de recherche scientifique recrute un post-doctorant en génération automatique de textes. Le candidat développera des méthodes pour extraire des graphes multilingues et affinera la mesure de factualité. Les compétences requises incluent des connaissances solides en mathématiques, en informatique et une maîtrise de PyTorch, avec un doctorat requis. Poste basé à Vandœuvre-lès-Nancy.

Qualifications

  • Solides connaissances des fondements mathématiques et informatiques des méthodes neuronales.
  • Compétence forte en informatique dont l'implémentation de modèles neuronaux avec PyTorch.
  • Anglais courant nécessaire.
  • Expérience en Traitement Automatique des Langues appréciée.

Responsabilités

  • Développer des méthodes pour extraire des graphes de connaissances à partir de textes multilingues.
  • Mesurer la factualité entre deux textes.
  • Créer des jeux de tests multilingues et évaluer le modèle.

Connaissances

Solides connaissances des fondements mathématiques et informatiques des méthodes neuronales
Compétence forte en informatique notamment implémentation de modèles neuronaux (pytorch)
Anglais courant
Expérience dans le domaine du Traitement Automatique des Langues

Formation

Niveau 8 Doctorat/diplômes équivalents

Description du poste

Post-doctorat en Génération Automatique de Textes à base H/F

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 54506 VANDOEUVRE LES NANCY (France)

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat Non renseigné
  • Expérience souhaitée Non renseigné
Rémunération Fourchette indicative pour les contractuels 3.021 € bruts mensuels, ajustable selon expérience€ brut/an Fourchette indicative pour les fonctionnaires Non renseignée
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Missions :
Le travail proposé pour ce post-doctorat porte sur la prédiction structurée multilingue. Il s'agit d'extraire des graphes de connaissances à partir de textes qui sont rédigés en différentes langues. En effet, les modèles existants sont souvent entraînés et testés principalement en monolingue. L'objectif du post-doctorat est double. Dans un premier temps, il s'agira de développer des méthodes pour extraire des graphes de connaissances à partir de textes écrits en différentes langues. Dans un second temps, on cherchera à utiliser ces méthodes pour mesurer la factualité (cohérence sémantique) entre deux textes, en monolingue ou en multilingue.
Activités :
Les activités prévues sont les suivantes:
- Revue de la litérature scientifique sur la prédiction structurée et la factualité
- Proposition d'un modèle neuronal pour la prédiction structurée multilingue
- Apprentissage du modèle sur des données (texte, graphe) créées par apprentissage distant à partir
des textes Wikipedia et de la base de connaissances Wikidata.
- Création de jeux de test (texte,graphe) multilingue
- Evaluation du modèle sur ce jeu de test
- Apprentissage d'une métrique de similarité pour les graphes de connaissance
- Application de cette métrique pour mesurer la factualité d'un texte par rapport à un autre texte (par exemple, pour mesurer la factualité d'un résumé par rapport au document source).
Contexte de travail :
La personne recrutée travaillera sous la supervision de Claire Gardent, Directrice de Recherche (Classe Exceptionnelle) CNRS au LORIA (Laboratoire Lorrain de recherche en informatique et ses applications). Elle bénéficiera de l'environnement de recherche du LORIA et de l'équipe MosAIk, une équipe à l'interface entre Intelligence Artificielle, Traitements automatique des langues et Connaissances.

Profil recherché

Competences :
- Solides connaissances des fondements mathématiques et informatiques des méthodes neuronales
- Compétence forte en informatique notamment implémentation de modèles neuronaux (pytorch)
- Anglais courant
- Expérience dans le domaine du Traitement Automatique des Langues
Contraintes et risques :
N/A

Niveau d'études minimum requis
  • Niveau Niveau 8 Doctorat/diplômes équivalents

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16000 chercheurs et plus de 16000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.

Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.

Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

Chercheuse / Chercheur

Des offres d'emplois recommandées pour vous
  • Fonction publique : Fonction publique de l'État
  • Fonction publique : Fonction publique de l'État
  • Fonction publique : Fonction publique de l'État
  • Fonction publique : Fonction publique de l'État
  • Fonction publique : Fonction publique de l'État
  • Fonction publique : Fonction publique de l'État
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.