Activez les alertes d’offres d’emploi par e-mail !

Assistant-e ingénieur-e en production, traitement de données et enquêtes H/F

CNRS

Villejuif

Sur place

EUR 35 000 - 45 000

Plein temps

Aujourd’hui

Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Un institut de recherche français situé à Villejuif cherche un-e Assistant-e ingénieur-e en production, traitement de données et enquêtes. Le candidat idéal contribuera à la conception de protocoles de collecte et à la préparation de corpus linguistiques pour publication. Une maîtrise des méthodes de traitement de données et une bonne connaissance des outils d'annotations sont nécessaires. Le poste requiert un travail en équipe avec des chercheurs, des experts informatiques, et un intérêt pour les langues à tradition orale.

Qualifications

Connaissance générale des enquêtes linguistiques de terrain.
Expérience avec les outils d'annotations fréquemment utilisés.
Capacité à assurer la traçabilité des procédures de traitement.

Responsabilités

Contribuer à la mise en œuvre de protocoles de collecte et de traitement.
Former et conseiller les chercheurs sur les outils d'annotation.
Assurer la qualité et la cohérence des corpus.

Connaissances

Méthodes et outils en traitement des données

Méthodes en production de données

Gestion des métadonnées

Systèmes de gestion de base de données

HTML, XML

Anglais B1

Formation

Maîtrise en linguistique ou domaine similaire

Outils

Elan

Toolbox

FLEx

Assistant-e ingénieur-e en production, traitement de données et enquêtes H/F

Date Limite Candidature : jeudi 15 janvier 2026 17:00:00 heure de Paris

Informations générales

Réservé aux agents CNRS (fonctionnaires et CDI) et aux fonctionnaires et CDI de droit public

Intitulé de l'offre : Assistant-e ingénieur-e en production, traitement de données et enquêtes H/F

Référence : UMR7107-MOBINT-P54009

Lieu de travail : VILLEJUIF

Institut : INSHS - Institut des sciences humaines et sociales

Date de publication : mercredi 3 décembre 2025

Session : Campagne Hiver 2026

Groupe de Fonction : AIG2

BAP : D - Sciences Humaines et Sociales

Emploi type : Assistante ingenieure ou assistant ingenieur en production, traitement de donnees et enquetes

Missions

Contribuer à la conception et la mise en œuvre de protocoles de collecte, de publication électronique et de traitement de corpus de langues rares. Participer à la préparation des corpus audio/vidéo annotés pour publication électronique (archivage), en étroite collaboration avec les chercheurs (Sciences du langage et Anthropologie linguistique) et les ingénieur-es et technicien-nes du laboratoire.

Activités

Participer à la conception et à l'organisation de corpus multimédia de langues rares dans une archive ouverte, la collection « Pangloss » (pangloss.cnrs.fr).
Contribuer à la valorisation et à la diffusion des résultats, en particulier via le site pangloss.cnrs.fr.
Assurer les opérations de codage et de recodage de métadonnées et d'annotations.
Contribuer à la qualité et à la cohérence des corpus par un suivi des projets, de la collecte à la publication électronique des données.
Former et conseiller les chercheurs en matière d'outils d'annotation et de traitement.
Aider à paramétrer les outils selon les particularités des projets et situations d'enquête.
Exercer une veille sur les méthodes d'enquêtes et les outils de traitement de données.

Compétences

Savoirs :

Méthodes et outils en traitement et analyse des données, en particulier celles des enquêtes linguistiques de terrain (Maîtrise).
Méthodes et outils en production de données (connaissance générale)
Principes de gestion des métadonnées : préconisations du réseau OLAC (Open Language Archives Community) d'archives ouvertes, outils spécialisés
Systèmes de gestion de base de données (connaissance générale)
Familiarité avec les technologies web : connaissance générale HTML, XML
Archivage pérenne des données de recherche (notions)
Connaissances générales en linguistique souhaitables. Un rudiment en ethnologie/anthropologie serait un plus.
Cadre légal et déontologique (connaissance générale)
Techniques de présentation écrite et orale
Langue anglaise : B1 (cadre européen commun de référence pour les langues)
Une familiarité préalable avec les outils logiciels d'annotations les plus couramment employés en linguistique de terrain serait un plus (Elan, Toolbox, FLEx…)

Savoirs faire :

Savoir assurer la traçabilité des procédures de traitement des informations.
Savoir transférer les données d’un logiciel à un autre (en traitement manuel ou en paramétrant des scripts Python existants).
Savoir participer à la rédaction des textes de présentation des divers corpus sur pangloss.cnrs.fr, en français et en anglais.

Savoirs-être :

Travailler en équipe avec des chercheurs, des spécialistes d'informatique, d'audiovisuel, d'Information Scientifique et Technique.
Savoir s'adapter d'une façon qui encourage la créativité.

Contexte de travail

La mission du LACITO (Langues et Civilisations à Tradition Orale, UMR 7107 CNRS / Sorbonne Nouvelle / INALCO) est de décrire et étudier la diversité des langues et des civilisations à tradition orale. Cette mission comporte un caractère d'urgence, du fait de l'érosion de cette diversité, parallèle à l'érosion des écosystèmes et la chute de la biodiversité. La collection Pangloss, archive ouverte principalement dédiée aux langues à tradition orale, regroupe des corpus dans près de 200 langues. Cette collection, en libre accès pour tous les publics (pangloss.cnrs.fr), est au cœur d'un environnement de Science ouverte, l'enjeu étant de parvenir à un progrès cumulatif des connaissances, grâce à un appui mutuel entre données, outils et publications.

Le LACITO est un laboratoire « à taille humaine », à la gouvernance collégiale : un laboratoire à l'écoute des langues, à l'écoute des gens. Au sein du laboratoire, la personne recrutée travaillera en équipe avec une ingénieure (qui assure dépôt des données en archive pérenne, maintenance d'éléments d'applications informatiques, et nouvelles innovations) et un technicien. Le travail autour des corpus oraux bénéficie de relations de confiance et d'étroite collaboration avec des partenaires d'autres institutions dont la Très Grande Infrastructure de Recherche Huma-Num, la Bibliothèque nationale de France et le Laboratoire Ligérien de Linguistique (voir à titre d'exemple : https://lll.cnrs.fr/actualite/datathon/).

Contraintes :

Du fait du rôle central des interactions avec les collègues, la présence sur site revêt une importance évidente. Le poste est néanmoins compatible sans difficulté particulière avec le télétravail partiel selon les règlements et préconisations du CNRS.

Obtenez votre examen gratuit et confidentiel de votre CV.

ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.

Noté « Excellent » sur la base de 19 310 évaluations