Activez les alertes d’offres d’emploi par e-mail !

Ingénieur d’études en traitement des données - CDD 12 mois

Université de Strasbourg

Strasbourg

Sur place

EUR 35 000 - 50 000

Plein temps

Hier
Soyez parmi les premiers à postuler

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

L'Université de Strasbourg recrute un Ingénieur d’études en traitement des données pour un CDD de 12 mois. Le poste implique le développement d'outils pour l'analyse des données juridiques et scientifiques, intégrant des méthodes de représentation innovantes. Le candidat idéal aura une expertise en traitement automatique du langage et en analyse de données. Ce rôle s'inscrit dans le cadre du développement de la chaire DENoTE et des projets de transformation numérique visant à répondre aux besoins de la digitalisation de l'activité universitaire.

Qualifications

  • Compétences en ingénierie informatique et traitement des données.
  • Expérience dans le développement de méthodes de représentation.
  • Capacité à travailler avec des données juridiques et scientifiques.

Responsabilités

  • Développer des outils d'analyse textuelle pour les données juridiques.
  • Concevoir des représentations innovantes des brevets et articles académiques.
  • Mettre en place des systèmes de génération alimentée par recherche.

Connaissances

Développement d'outils d'analyse
Traitement automatique du langage
Analyse de données
Représentation vectorielle
Modélisation

Formation

Diplôme en informatique ou domaine similaire

Description du poste

Ingénieur d’études en traitement des données - CDD 12 mois, Strasbourg

Université de Strasbourg

Emploi ouvert aux agents contractuels uniquement

CDD 12 mois (renouvelable) à compter du 01/11/24

Catégorie : A Corps : Ingénieur d’études

Rémunération selon grille de la Fonction Publique

Ce poste entre dans le développement du CEIPI dans un contexte de transformation numérique de la composante répondant aux enjeux de la digitalisation de ses activités.

Ce poste s’inscrit en particulier dans le développement des activités prévues dans le cadre de la chaire «Dynamique des normes en Europe face aux technologies émergentes» (DENoTE) portée par le CEIPI.

L’agent interviendra dans le domaine de l’ingénierie informatique en assurant la conception et le développement d‘outils de traitement automatique du langage et d’analyse de données appliqués aux données juridiques, notamment textuelles, à l’analyse du lien entre science, technologies et normes et aux applications des modèles au service de la description des processus créatif.

  • Activités principales:

1. Développement d’outils d’analyse textuelle de données juridiques et scientifique:

Le/la titulaire du poste sera responsable de la conception et de la mise en place d'une méthode innovante de représentation des brevets et des articles académiques, optimisée pour le suivi des changements et de l’évolution des thématiques dans divers domaines scientifiques et technologiques. Cette représentation devra intégrer l’information temporelle et les contributions techniques majeures des documents tout en restant invariante face aux styles de rédaction.

Développer une méthode de représentation des documents : concevoir et développer une méthode de représentation combinant l’information temporelle et les contributions techniques principales des brevets et articles académiques.

Générer une vue globale de l’évolution des concepts : utiliser la nouvelle méthode de représentation des documents pour créer une vue d’ensemble de l’évolution des concepts clés dans des domaines spécifiques.

Détection de l’émergence de nouveaux concepts : mettre en place des méthodes de détection des nouveaux concepts en mesurant les différences entre les nouveaux clusters de concepts et ceux déjà existants, afin d’évaluer la nouveauté et l’importance des nouveaux concepts dans un domaine.

2. Développement d’outils de représentation des données de style:

Le/la titulaire du poste sera responsable de la conception et du développement d’outils d’analyse de la notion de style artistique.

Représentation des styles : développer des techniques basées sur des embeddings pour représenter et analyser l'évolution des "styles artistiques" à partir de données textuelles (critiques, descriptions, théories artistiques) ou d’images d'œuvres d'artistes.

Modélisation de l’évolution stylistique : Identifier et modéliser les caractéristiques stylistiques des œuvres et auteurs pour créer une représentation évolutive de l'évolution des styles artistiques.

Visualisation : Utiliser les embeddings pour visualiser les similarités et les différences entre les styles, et suivre l’émergence et la transformation des styles artistiques au fil du temps.

3. Développement d'un système de RAG (Retrieval-Augmented Generation) dédié à l’exploitation de textes juridiques :

Le/la titulaire du poste étudiera la faisabilité et proposera des solutions pour le développement d’outils de représentation et d’indexation de documents textuels juridiques (jurisprudences, textes, règlementaires, codes, etc.).

Représentation vectorielle des documents : élaborer une méthode de représentation spécifique aux textes juridiques, prenant en compte les particularités du langage juridique, les structures des documents (ex. articles de lois, jugements, contrats) et les relations entre les différentes parties de texte.

Mise en œuvre d’une base de donnée vectorielle : Concevoir une architecture de base de données vectorielle optimisée pour le stockage et la récupération efficace de textes juridiques représentés par des embeddings, permettant une recherche sémantique avancée et une analyse comparative.

Interface : Développer une interface utilisateur interactive permettant d’exploiter ces textes juridiques, incluant des fonctionnalités de recherche, d’analyse et de visualisation des relations et de l’évolution des concepts juridiques, en prenant en charge la mise à jour dynamique des données et l’intégration des nouvelles sources de textes juridiques.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.