Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

POST-DOCTORANT(E) CENTRE DE RESSOURCES COMPUTATIONNELLES BIBLISSIMA+, CLUSTER 7

École nationale des chartes

Paris

Sur place

EUR 30 000 - 40 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une institution académique renommée à Paris recherche un(e) postdoctorant(e) pour assurer l'alignement des référentiels de lemmes du français médiéval. Le candidat idéal aura une double compétence en philologie et en humanités numériques, avec un doctorat récent. Des compétences en apprentissage machine et en analyse de données textuelles sont nécessaires. Ce poste offre des opportunités de collaboration avec divers partenaires dans le domaine des humanités numériques.

Qualifications

  • Manipuler et enrichir des jeux de données à partir de corpus.
  • Alimenter un dépôt GitHub avec des données.
  • Intégration continue pour vérifier la qualité des données.
  • Lire et transcrire le français médiéval.

Responsabilités

  • Assurer l'alignement des référentiels de lemmes du français médiéval.
  • Contribuer à d'autres livrables de Biblissima.
  • Modélisation des variantes textuelles.

Connaissances

Double compétence en philologie et en humanités numériques
Philologie médiévale et ecdotique
Standards de données (XML/TEI)
Apprentissage machine et traitement automatique des langues
Analyse computationnelle de données textuelles

Formation

Doctorat en lettres ou linguistique

Outils

GitHub
Description du poste
À propos de nous

Fondée en 1821, composante de l’Université PSL, membre du Campus Condorcet, partie prenant de l’espace Richelieu, l’École nationale des chartes - PSL est un grand établissement universitaire, qui forme des experts en sciences historiques et philologiques et en humanités numériques.

Fondé en 1834, installé sur le site du Campus Condorcet, le Comité des travaux historiques et scientifiques est un institut de l’École, coordonne plus de 3000 sociétés savantes et est un éditeur scientifique en SHS.

Mission

Grâce Au Soutient Financier De L’Equipex Biblissima+ Le CJM a Créé Un Centre De Ressources Computationnelles Pour Les Langues à Variation Graphique Qui Se Concentrera Sur

  • la question de l'annotation linguistique (voir infra),
  • les traitements qu'elle permet pour répondre aux questions de datation, localisation ; alignement de différentes versions et collation ; détection des entités nommées.

Pour la stylométrie, on souhaite disposer de fonctionnalités pour faire automatiquement des rapprochements entre textes en fonction du style ou du contenu, voire de détection des paraphrases, en particulier d’une langue à l’autre.

L’enjeu est le traitement automatique des langues historiques à forte variation graphique et la mise à disposition d'outils (interfaces web, API, algorithmes) et de modèles (essentiellement pour les langues gallo-romanes et le latin). À terme, des services dialectométriques (un système de cartes de chaleur) et stylométriques sont envisagés.

Missions du poste

Dans ce contexte, le CJM recrute un ou une postdoctorant(e) chargé(e) d’assurer l’alignement des référentiels de lemmes du français médiéval utilisés par les outils de lemmatisation actuellement disponibles. L’un des objectifs est d’obtenir à terme des corpus construits à partir de textes lemmatisés selon des référentiels différents (TL, DEAF, DMF, etc.). La mission du postdoctorant sera effectuée en collaboration avec d’autres acteurs de la lemmatisation du français médiéval, notamment avec Alexey Lavrentiev (IRHIM ENS Lyon), qui contribuera à la coordination des tâches. Des collaborations avec le DMF (Gilles Souvay) et GallRom (Martin Glessgen) ainsi qu’avec des partenaires de Biblissima au sein ou à l’extérieur du cluster 7 sont attendues (Inria, Laurence Mellerin, Katarzyna Kapitan).

Le postdoctorant ou la postdoctorante se consacrera principalement à l’alignement des lemmes, mais il ou elle pourra également contribuer à d’autres livrables de Biblissima, notamment au sein des clusters 5b et 7. Les domaines privilégiés sont : la mise au point d’un schéma pour l’encodage des glossaires d’édition de texte ; la modélisation des variantes textuelles et la visualisation de la variation ; la contribution à Biblissima textes (édition numérique et collaboration avec le pôle de Caen).

Profil

COMPETENCES REQUISES

  • Une double compétence en philologie et en humanités numériques est requise.
  • Philologie médiévale et ecdotique
  • Standards de données appropriés (notamment XML/TEI)
  • Apprentissage machine (deep learning) et traitement automatique des langues
  • Analyse computationnelle de données textuelles.

Plus en particulier, la personne engagée devra être à même de manipuler, voire d'enrichir des jeux de données à partir de corpus sélectionnés pour améliorer des modèles de traitement automatique ou d'analyse des langues riches en variation, en tout particulier les langues médiévales.

  • La personne recrutée devra également être capable :
  • d’alimenter un dépôt gitHub avec des données ;
  • de faire de l’intégration continue pour vérifier la qualité des données ;
  • de lire et transcrire le français médiéval, mais aussi, si possible, d’autres langues (latin et autres langues romanes);

Le postdoctorant ou la postdoctorante devra faire montre d’excellentes capacités de travail en équipe et d’organisation.

Qualification
  • doctorat en lettres ou linguistique soutenu depuis moins de trois ans.

Référence de l'offre : nei96pn5wt

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.