Activez les alertes d’offres d’emploi par e-mail !

[H/F] Docrorant(e) Analyse syntaxique de textes mathématiques et alignement avec des mathématiq[...]

CNRS

Paris

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 2 jours
Soyez parmi les premiers à postuler

Résumé du poste

Un organisme de recherche prestigieux recherche un(e) doctorant(e) pour un projet sur l'analyse syntaxique de textes mathématiques. Ce rôle nécessite de concevoir un analyseur syntaxique et de produire des arbres logiques. Le poste est financé par le projet ERC Malinca pour une durée de 36 mois. Une rémunération de 2200,00 € mensuel est proposée, et le début du contrat est prévu pour le 1 octobre 2025.

Qualifications

  • Compétence en analyse syntaxique de textes.
  • Connaissance des théories de structure rhétorique et de représentation du discours.
  • Capacité à travailler avec des corpus de textes mathématiques.

Responsabilités

  • Concevoir et implémenter un analyseur syntaxique pour documents mathématiques.
  • Produire un arbre syntaxique et logique à partir de textes.
  • Construire un corpus aligné entre la langue naturelle et les scripts de preuve.

Connaissances

Analyse syntaxique
Programmation
Connaissance des mathématiques formalisées

Formation

Master en mathématiques ou informatique

Description du poste

[H/F] Docrorant(e) Analyse syntaxique de textes mathématiques et alignement avec des mathématiques formalisées

Cette offre est disponible dans les langues suivantes :

Date Limite Candidature : mercredi 20 août 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : [H/F] Docrorant(e) Analyse syntaxique de textes mathématiques et alignement avec des mathématiques formalisées
Référence : UMR8243-JEMSAM0-022
Nombre de Postes : 1
Lieu de travail : PARIS 13
Date de publication : mercredi 30 juillet 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2025
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2200,00 € mensuel
Section(s) CN : 01 - Interactions, particules, noyaux du laboratoire au cosmos

Description du sujet de thèse

Analyse syntaxique de textes mathématiques et alignement avec des mathématiques formalisées

L’objectif de la thèse sera de concevoir et d'implémenter un analyseur syntaxique (ou « parser ») de discours afin d'analyser des documents mathématiques écrits en langue naturelle, et de produire un arbre syntaxique et logique, en s'inspirant des travaux sur la RST (Rhetorical Structure Theory) et la SDRT (Segmented Discourse Representation Theory). Il s'agira de comprendre, de manière à la fois conceptuelle et empirique, comment adapter ces outils à un texte de référence, tel que le livre d'Algèbre de Roger Godement, en français ou en anglais, ainsi qu'à un corpus de textes mathématiques bien choisi. L'un des principaux enjeux de ce travail de thèse sera de construire de manière automatique ou semi-automatique un corpus aligné entre des documents mathématiques écrits en langue naturelle et des scripts de preuve produits dans un assistant à la démonstration.

Contexte de travail

Le poste est financé par le projet ERC Synergie Malinca, et sera mené sous la direction de Benoît Crabbé et Paul-Andre Melliès. Le projet Malinca a pour objectif de participer au développement d’une nouvelle génération d’assistants à la preuve, qui intègrent dans leurs noyaux une couche linguistique et des outils d'assistance automatisée pour guider le scientifique et faciliter la construction de documents mathématiques certifiés, depuis le choix des concepts et des définitions, jusqu’à l'élaboration des théorèmes et des démonstrations.

Contraintes et risques

pas de risques ni contrainte

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.