Recherche en mathématiques appliquées
Les principales questions abordées dans le cadre de ce projet sont :
1 la détection et l'identification de motifs d'intérêt (illustrations, glose, annotations...) présents dans les numérisations de manuscrits médiévaux, le positionnement de ces motifs sur la page,
2. l'identification du texte sur la numérisation, ainsi que la description précise des caractéristiques de celui-ci (positionnement, nombre de colonnes, taille des marges, module,...),
3. la détection et l'identification automatique de signes visuels structurant la page (symboles, abréviations, renvois,...)
4. la différenciation entre texte principal et tout type d'annotation paratextuelle, dont la glose. Il s'agit d'annotations se présentant sous la forme de commentaires structurés.
5. mise en relation automatique de la glose avec la partie du texte à laquelle elle se rapporte,
6. le repérage de strates d'écriture rédigées à des périodes différentes qui seront ordonnées chronologiquement.
Les principaux outils pour mener ce projet à bien consistent pour une part en des stratégies préexistantes telles que les approches de reconnaissance de caractères (HTR), certaines architectures de réseaux de neurones profonds préentraînés (Kraken,...), des stratégies de segmentation d'image classiques en vision artificielle (computer vision).
Toutefois une spécificité importante du présent projet tient au faible nombre d'exemples d'apprentissage, ce qui rend l'entraînement des réseaux de neurones profonds habituellement difficile. Il est donc nécessaire de développer des stratégies alternatives reposant par exemple sur l'apprentissage auto-supervisé (selfsupervised learning) ou encore des techniques d'augmentation de données à l'aide de modèles de diffusion par exemple.
Sur un plan historique
Les manuscrits juridiques sont la cible de ce projet. À partir du XIIe siècle se met en place une Europe du droit. Elle est la conséquence, notamment, de la codification des droits romains et canons, de la revendication par les princes du pouvoir de légiférer, d'une hiérarchisation des justices à leur profit, de la judiciarisation de la vie sociale qui fait des juges et des juristes des figures centrales ou encore, de manière plus générale, d'un besoin social de la loi et du droit. Cette Europe du droit voit une production croissante de manuscrits juridiques. De nature très hétérogène (codes, coutumiers, ordonnances, statuts, accords de parlement, livres universitaires, de la pratique ou encore manuscrits personnels), ce corpus construit néanmoins une 2 sémiotique juridique commune dans la société médiévale. Écriture, mise en page, décoration construisent la singularité scripturaire et matérielle des manuscrits juridiques : la norme et son application est ainsi dépendante de ce standard d'écriture. En lien avec le programme du Lamop sur les technologies législatives, ce projet a pour originalité de développer une approche interdisciplinaire, combinant codicologie quantitative et intelligence artificielle (IA) pour analyser un large corpus de manuscrits numérisés. L'objectif est de décrypter les différentes strates d'écriture (texte principal, gloses, annotations marginales, etc.), de les ordonner chronologiquement et d'étudier leurs interactions. Si cette approche s'intéresse à la spécificité de la scripturalité juridique - la question de la construction de l'authenticité de la norme par exemple –, la méthodologie ainsi construite pourra s'appliquer à d'autres corpus afin de renouveler l'approche, en particulier numérique, du rôle du livre dans la société médiévale.
Le post-doctorant sera responsable des tâches suivantes :
Conception et développement d'algorithmes :
• Concevoir et développer des algorithmes appropriés pour répondre aux questions de recherche proposées.
• Implémenter ces algorithmes dans un langage de programmation adéquat.
• Optimiser les performances des algorithmes développés, en termes de précision, de robustesse et d'efficacité.
Collecte et préparation de données :
• Collecter et préparer les données nécessaires à ses recherches, qui pourront inclure des documents numérisés, des images et du texte.
• Préparer ces données afin de les rendre exploitables par les algorithmes.
• Création d'un dataset support des analyses
Expérimentation et validation :
• Mener des expériences pour tester et valider ses hypothèses de recherche.
• Collaborer avec les autres membres de l'équipe de recherche, et éventuellement avec des partenaires extérieurs, pour mener à bien ces expériences.
Valorisation de travaux :
• Rédaction (en anglais) et soumission d'articles dans des revues scientifiques à comité de lecture de haut niveau en Mathématiques appliquées et en Histoire.
• Soumission de contributions et exposés (en anglais) dans des conférences nationales et internationales de haut niveau.
• Participation active à des séminaires.
• Organisation d'événements scientifiques
Savoir-faire
• Solides compétences en traitement d'images et en reconnaissance de formes.
• Expertise en apprentissage automatique (machine learning) et en intelligence artificielle, notamment en apprentissage profond (deep learning).
• Maîtrise des outils de programmation (Python, etc.) et des bibliothèques associées (TensorFlow, PyTorch, OpenCV, etc.).
Compétences spécifiques :
• Expérience dans la détection et la reconnaissance de motifs visuels.
• Capacité à développer des algorithmes pour l'analyse de documents complexes.
• Curiosité pour l'histoire
Savoir-être :
• Rigueur scientifique et capacité d'analyse.
• Autonomie et esprit d'initiative.
• Aptitude à travailler en équipe.
Formation souhaitée :
• Doctorat en mathématiques appliquées, informatique, traitement d'images, intelligence artificielle. Si les compétences techniques sont maîtrisées il peut s'agir d'un domaine connexe comme les humanités numériques.
Pour faire acte de candidatures, envoyer CV et lettre de motivation à :
Stéphane Lamassé : stephane.lamasse@univ-paris1.fr
Alain Celisse : alain.celisse@univ-paris1.fr
Date limite de candidature : 13 juin 2025
Entretien à prévoir : L'audition pourra se tenir en visioconférence
L’université Paris 1 Panthéon-Sorbonne associe le glorieux héritage du collège fondé par Robert de Sorbon au XIIIe siècle avec un projet pluridisciplinaire novateur. Première université française en sciences humaines et sociales (SHS), elle cultive depuis 1971 un esprit unique qui associe une approche scientifique exigeante et l’ambition de faire émerger de nouveaux savoirs qui transforment le monde.
Implantée sur 25 sites parisiens et franciliens, ouverte sur le monde et l'Europe avec les onze établissements qui composent l'alliance Una Europa, elle accompagne près de 45 000 étudiants par an répartis en 10 unités de formation et de recherche, 4 instituts, 37 unités de recherche ainsi que 10 écoles doctorales et revendique l’un des plus grands réseaux d’alumni du continent. L’université compte 2600 personnels dont 1200 personnels BIATSS et 1400 personnels enseignants. Son budget annuel s’élève à plus de 220 millions d’euros.
Grâce à son exceptionnel éventail de disciplines, elle forme des chercheurs, des enseignants, des professionnels du droit, des cadres pour les entreprises et l’administration, des économistes, des artistes… mais surtout des citoyens critiques qui analysent le monde qui les entoure et imaginent des solutions concrètes face aux nouveaux enjeux de notre société.
L’université Paris 1 Panthéon-Sorbonne est aujourd’hui la grande université française en sciences humaines et sociales, engagée pour replacer l’humain au cœur de l’approche scientifique, pour des sciences plus humaines ainsi que pour une société plus juste et durable. L’université Paris 1 Panthéon-Sorbonne engagée dans plusieurs projets stratégiques : sa Fondation universitaire, la stratégie d’alliance avec Sorbonne Alliance (Paris 1, ESCP Business School, université Sorbonne Nouvelle), le Campus Condorcet, son projet d’Université européenne UNA EUROPA, les projets Sorb’Rising (PIA 4 « Excellences ») et RAMPE (appel à projets ASDESR), la labellisation HRS4R obtenue en 2021.
Les informations à caractère personnel recueillies font l’objet d’un traitement par Emploipublic.fr du Groupe Moniteur RCS Nanterre B 403 080 823. Elles sont nécessaires entre autres, à la création de votre compte et sont enregistrées dans nos fichiers. Groupe Moniteur ou toutes sociétés du groupe Infopro Digital pourront utiliser ces fichiers afin de vous proposer des produits et/ou services analogues. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles .