Activez les alertes d’offres d’emploi par e-mail !

Ingénieur exploitation de données textuelles H / F

CNRS

Aix-en-Provence

Hybride

EUR 40 000 - 60 000

Plein temps

Il y a 3 jours
Soyez parmi les premiers à postuler

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Le CNRS recherche un Ingénieur en exploitation de données textuelles pour un projet de recherche sur les édifices chrétiens. Le poste implique l'enrichissement d'un corpus textuel et iconographique, ainsi que l'utilisation de méthodes d'analyse avancées. Le candidat idéal aura une maîtrise du latin et des compétences en XML, tout en travaillant en étroite collaboration avec une équipe scientifique.

Prestations

Télétravail partiel possible sous conditions

Qualifications

  • Expérience souhaitée : Indifférent.
  • Capacité à suivre les étapes d’un projet de développement.

Responsabilités

  • Enrichir le corpus de références textuelles et lexicales.
  • Participer à l’identification des extraits de textes pertinents.
  • Constituer les notices descriptives des passages édités.
  • Indexer les textes en lien avec les vocabulaires contrôlés.
  • Contribuer à la spécification fonctionnelle de l’application Web.

Connaissances

Maîtrise du latin
Bonne connaissance des bases de textes latins
Maîtrise des Guidelines XML / TEI
Maîtrise des environnements de publication XML
Notions de programmation XSLT
Compréhension de base des APIs IIIF
Connaissances en civilisation de l’Antiquité tardive et du Moyen Age
Rigueur et autonomie
Capacité à travailler en équipe
Aptitude à rédiger des spécifications claires

Formation

BAC+3 / 4

Outils

Oxygen Editor

Description du poste

Intitulé de l'offre : Ingénieur exploitation de données textuelles H / F

Référence : UMR7297-JOHBUR-003

Nombre de Postes : 1

Lieu de travail : AIX EN PROVENCE

Durée du contrat : 36 mois

Date d'embauche prévue : 5 septembre 2025

Quotité de travail : Complet

Rémunération : Entre 2540 et 3786 euros selon expérience

Niveau d'études souhaité : BAC+3 / 4

Expérience souhaitée : Indifférent

BAP : D - Sciences Humaines et Sociales

Emploi type : Ingénieur-e d’études en analyses des sources historiques et culturelles

Porté par Gaëlle de la Portbarré-Viard pour l’université Aix-Marseille, le projet ANR E-cclesia collecte et étudie des corpus de textes et d’images relatifs aux édifices chrétiens entre le IVe et le XIIe siècle. Il développe pour ce faire une base de données dédiée. Une base de données test Heurist (hébergée sur Humanum) a été créée. Avec un échantillon représentatif de textes et d’images, cet outil a permis la description d’un premier corpus constitué d’extraits de textes et d’images d’édifices issues d’objets patrimoniaux produits durant la période. Il a également assuré la faisabilité quantitative et qualitative du projet E-cclesia, tout en conduisant à la formulation d’hypothèses de recherche solides. La base doit évoluer pour s’adapter à l’évolution et l’accroissement du corpus de référence : enrichissement des descripteurs et des outils d’indexation pour améliorer la cherchabilité des données dans le cadre de recherches pluridisciplinaires et leur interopérabilité au sein du système et avec les bibliothèques numériques préexistantes. La personne recrutée participera à l’élaboration du corpus textuel et iconographique correspondant au projet E-CCLESIA et à la mise en œuvre des méthodes et des outils d’analyse de ce corpus.

Activités

La personne recrutée aura pour tâches principales :

  • 1.d’enrichir le corpus de références textuelles et lexicales (latin) ; cet enrichissement se fera par la saisie des fiches dans la base de données et par la collecte de nouveaux textes;
  • 2. Participer à l’identification des extraits de textes pertinents;
  • 3. De constituer les notices descriptives des passages édités, en lien avec les responsables scientifiques et l’ingénieur en charge du système d’information ;
  • 4. D’indexer les textes en lien avec les vocabulaires contrôlés définis par les porteurs du projet ;
  • 5. Assurer la maintenance et la mise à jour des vocabulaires contrôlés et leur liage;
  • 6. De contribuer, avec l’ingénieur en charge du système d’information, à la spécification fonctionnelle de l’application Web de consultation de ces notices ;

7. De suivre le développement de cette application de consultation en lien avec l’ingénieur en charge du système d’information et les développeurs d’AMU.

Compétences

  • Maîtrise du latin ;
  • Bonne connaissance des bases de textes latins et des outils lexicographiques;
  • Maîtrise des Guidelines XML / TEI et des langages de description des documents XML (ODD, Relax NG) ;
  • Maîtrise des environnements de publication XML (Oxygen Editor) ;
  • Notions de programmation XSLT et / ou Xquery (BaseX) ;
  • Compréhension de base des APIs IIIF pour l’appel des images ;
  • Connaissances en civilisation de l’Antiquité tardive et du Moyen Age;
  • Rigueur et autonomie dans le traitement des données textuelles;
  • Capacité à travailler en équipe;
  • Aptitude à rédiger des spécifications claires et précises;
  • Sens de l’organisation et capacité à suivre les étapes d’un projet de développement.

Contexte de travail

Ce poste est accueilli par le laboratoire TDMAM à la MMSH d’Aix-en-Provence.

Quotité et horaires de travail à préciser selon le profil du candidat.

Télétravail partiel possible sous conditions.

L’ingénieur travaillera sous la responsabilité directe de la coordinatrice scientifique de l’ANR et sous l'autorité hiérarchique de la Directrice de l'Unité.

L'activité s'exerce en relations régulières avec les autres membres de l’équipe et en particulier avec l’ingénieur chargé de la conception de la base de données.

Contraintes et risques

Exercice de l'activité sur le site de la MMSH à Aix-en-Provence.

Créer une alerte emploi pour cette recherche

Ingnieur Hf • AIX EN PROVENCE, Provence Corse

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.