
Activez les alertes d’offres d’emploi par e-mail !
Générez un CV personnalisé en quelques minutes
Décrochez un entretien et gagnez plus. En savoir plus
Une institution académique renommée à Paris recherche un(e) postdoctorant(e) pour assurer l'alignement des référentiels de lemmes du français médiéval. Le candidat idéal aura une double compétence en philologie et en humanités numériques, avec un doctorat récent. Des compétences en apprentissage machine et en analyse de données textuelles sont nécessaires. Ce poste offre des opportunités de collaboration avec divers partenaires dans le domaine des humanités numériques.
Fondée en 1821, composante de l’Université PSL, membre du Campus Condorcet, partie prenant de l’espace Richelieu, l’École nationale des chartes - PSL est un grand établissement universitaire, qui forme des experts en sciences historiques et philologiques et en humanités numériques.
Fondé en 1834, installé sur le site du Campus Condorcet, le Comité des travaux historiques et scientifiques est un institut de l’École, coordonne plus de 3000 sociétés savantes et est un éditeur scientifique en SHS.
Grâce Au Soutient Financier De L’Equipex Biblissima+ Le CJM a Créé Un Centre De Ressources Computationnelles Pour Les Langues à Variation Graphique Qui Se Concentrera Sur
Pour la stylométrie, on souhaite disposer de fonctionnalités pour faire automatiquement des rapprochements entre textes en fonction du style ou du contenu, voire de détection des paraphrases, en particulier d’une langue à l’autre.
L’enjeu est le traitement automatique des langues historiques à forte variation graphique et la mise à disposition d'outils (interfaces web, API, algorithmes) et de modèles (essentiellement pour les langues gallo-romanes et le latin). À terme, des services dialectométriques (un système de cartes de chaleur) et stylométriques sont envisagés.
Dans ce contexte, le CJM recrute un ou une postdoctorant(e) chargé(e) d’assurer l’alignement des référentiels de lemmes du français médiéval utilisés par les outils de lemmatisation actuellement disponibles. L’un des objectifs est d’obtenir à terme des corpus construits à partir de textes lemmatisés selon des référentiels différents (TL, DEAF, DMF, etc.). La mission du postdoctorant sera effectuée en collaboration avec d’autres acteurs de la lemmatisation du français médiéval, notamment avec Alexey Lavrentiev (IRHIM ENS Lyon), qui contribuera à la coordination des tâches. Des collaborations avec le DMF (Gilles Souvay) et GallRom (Martin Glessgen) ainsi qu’avec des partenaires de Biblissima au sein ou à l’extérieur du cluster 7 sont attendues (Inria, Laurence Mellerin, Katarzyna Kapitan).
Le postdoctorant ou la postdoctorante se consacrera principalement à l’alignement des lemmes, mais il ou elle pourra également contribuer à d’autres livrables de Biblissima, notamment au sein des clusters 5b et 7. Les domaines privilégiés sont : la mise au point d’un schéma pour l’encodage des glossaires d’édition de texte ; la modélisation des variantes textuelles et la visualisation de la variation ; la contribution à Biblissima textes (édition numérique et collaboration avec le pôle de Caen).
COMPETENCES REQUISES
Plus en particulier, la personne engagée devra être à même de manipuler, voire d'enrichir des jeux de données à partir de corpus sélectionnés pour améliorer des modèles de traitement automatique ou d'analyse des langues riches en variation, en tout particulier les langues médiévales.
Le postdoctorant ou la postdoctorante devra faire montre d’excellentes capacités de travail en équipe et d’organisation.
Référence de l'offre : nei96pn5wt