Activez les alertes d’offres d’emploi par e-mail !

Post-doctorat en Génération Automatique de Textes à base H/F

CNRS

Vandœuvre-lès-Nancy

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 2 jours

Soyez parmi les premiers à postuler

Résumé du poste

Un institut de recherche recherche un post-doctorant pour développer des méthodes d'extraction de graphes de connaissances multilingues. Ce poste nécessite un doctorat, de solides compétences en mathématiques et en informatique, ainsi qu'une expérience en traitement automatique des langues. Le candidat travaillera sous la direction d'une chercheuse au CNRS, dans un environnement dynamique et collaboratif.

Qualifications

Solides compétences en mathématiques et informatique des méthodes neuronales.
Expérience en implémentation de modèles neuronaux, notamment avec pytorch.
Anglais courant requis.
Expérience en Traitement Automatique des Langues appréciée.

Responsabilités

Développer des méthodes pour extraire des graphes de connaissances.
Mesurer la factualité entre textes en monolingue et multilingue.
Revue de littérature scientifique sur la prédiction structurée.
Évaluer les modèles sur des jeux de test multilingues.

Connaissances

Connaissances en mathématiques et informatique

Implémentation de modèles neuronaux (pytorch)

Anglais courant

Traitement Automatique des Langues

Formation

Doctorat

Portail > Offres > Offre UMR7503-CLAGAR-007 - Post-doctorat en Génération Automatique de Textes à base H/F

Post-doctorat en Génération Automatique de Textes à base H/F

Cette offre est disponible dans les langues suivantes :

Date Limite Candidature : lundi 18 août 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Post-doctorat en Génération Automatique de Textes à base H/F
Référence : UMR7503-CLAGAR-007
Nombre de Postes : 1
Lieu de travail : VANDOEUVRE LES NANCY
Date de publication : lundi 28 juillet 2025
Type de contrat : Chercheur en contrat CDD
Durée du contrat : 28 mois
Date d'embauche prévue : 1 septembre 2025
Quotité de travail : Complet
Rémunération : 3.021 € bruts mensuels, ajustable selon expérience
Niveau d'études souhaité : Doctorat
Expérience souhaitée : Indifférent
Section(s) CN : 07 - Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues

Missions

Le travail proposé pour ce post-doctorat porte sur la prédiction structurée multilingue. Il s'agit d'extraire des graphes de connaissances à partir de textes qui sont rédigés en différentes langues. En effet, les modèles existants sont souvent entraînés et testés principalement en monolingue. L'objectif du post-doctorat est double. Dans un premier temps, il s'agira de développer des méthodes pour extraire des graphes de connaissances à partir de textes écrits en différentes langues. Dans un second temps, on cherchera à utiliser ces méthodes pour mesurer la factualité (cohérence sémantique) entre deux textes, en monolingue ou en multilingue.

Activités

Les activités prévues sont les suivantes:
- Revue de la litérature scientifique sur la prédiction structurée et la factualité
- Proposition d'un modèle neuronal pour la prédiction structurée multilingue
- Apprentissage du modèle sur des données (texte, graphe) créées par apprentissage distant à partir
des textes Wikipedia et de la base de connaissances Wikidata.
- Création de jeux de test (texte,graphe) multilingue
- Evaluation du modèle sur ce jeu de test
- Apprentissage d'une métrique de similarité pour les graphes de connaissance
- Application de cette métrique pour mesurer la factualité d'un texte par rapport à un autre texte (par exemple, pour mesurer la factualité d'un résumé par rapport au document source).

Compétences

- Solides connaissances des fondements mathématiques et informatiques des méthodes neuronales
- Compétence forte en informatique notamment implémentation de modèles neuronaux (pytorch)
- Anglais courant
- Expérience dans le domaine du Traitement Automatique des Langues

Contexte de travail

La personne recrutée travaillera sous la supervision de Claire Gardent, Directrice de Recherche (Classe Exceptionnelle) CNRS au LORIA (Laboratoire Lorrain de recherche en informatique et ses applications). Elle bénéficiera de l'environnement de recherche du LORIA et de l'équipe MosAIk, une équipe à l'interface entre Intelligence Artificielle, Traitements automatique des langues et Connaissances.

Contraintes et risques

N/A

Obtenez votre examen gratuit et confidentiel de votre CV.

ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.

Noté « Excellent » sur la base de 17 140 évaluations

Post-doctorat en Génération Automatique de Textes à base H/F

CNRS

Vandœuvre-lès-Nancy

Sur place

EUR 40 000 - 60 000

Plein temps

Résumé du poste

Qualifications

Responsabilités

Connaissances

Formation

Description du poste

Entreprise

Services

Ressources gratuites

Assistance

Post-doctorat en Génération Automatique de Textes à base H/F

CNRS

Vandœuvre-lès-Nancy

Sur place

EUR 40 000 - 60 000

Plein temps

Résumé du poste

Qualifications

Responsabilités

Connaissances

Formation

Description du poste

Suivez-nous

Entreprise

Services

Ressources gratuites

Assistance

EUR 40 000 - 60 000