Activez les alertes d’offres d’emploi par e-mail !

Data Scientist NLP [F/H]

JR France

Nantes

Sur place

EUR 45 000 - 65 000

Plein temps

Il y a 18 jours

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Une entreprise dynamique dans le secteur bancaire recherche un(e) ingénieur(e) data spécialisé(e) en traitement de documents. Vous contribuerez à créer une base de connaissances à partir de documents non structurés, en développant un pipeline d’extraction et normalisation. Ce poste à Nantes offre une mission stratégique au sein d'un environnement stimulant avec des opportunités de collaboration et d'impact sur la gestion des connaissances.

Prestations

Environnement stimulant avec équipes métier
Projets innovants autour de l'IA
Flexibilité sur le rythme de travail

Qualifications

  • Expérience de 3 ans minimum dans l'informatique.
  • Rigueur dans la documentation et la standardisation.
  • Connaissance de la plateforme Domino Data Lab appréciée.

Responsabilités

  • Concevoir un pipeline d’extraction et de nettoyage de contenus textuels.
  • Collaboration avec l’équipe Knowledge Management pour affiner les modèles.
  • Mise en place d’un pipeline automatisé réutilisable.

Connaissances

Traitement de documents non structurés
NLP (Natural Language Processing)
Analyse
Autonomie

Formation

Diplôme d'ingénieur ou Bac + 5 équivalent

Outils

pdfminer
python-docx
BeautifulSoup
spaCy
Tesseract

Description du poste

Dans le cadre de l’accélération de l’intelligence artificielle au sein d'une banque commerciale, nous recherchons un(e) ingénieur(e) data spécialisé(e) en traitement de documents pour une mission sur site à Nantes .

Ce projet s'inscrit dans un chantier stratégique de Knowledge Management (KM) visant à créer une base de connaissance centralisée, à partir de documents non structurés (PDF, Word, HTML). L’objectif est de formaliser la connaissance de manière standardisée et réutilisable à long terme, indépendamment des cas d’usage spécifiques.

Objectif de la mission

Concevoir un pipeline complet d’extraction, de nettoyage et de structuration de contenus textuels issus de documents hétérogènes, afin de les organiser dans un format pivot enrichi (Markdown ou JSON).

Vos principales activités

  • Extraction du texte depuis des fichiers PDF, Word, HTML via des librairies adaptées.
  • Nettoyage et normalisation des contenus (suppression de bruit, traitements OCR si nécessaire).
  • Segmentation des textes en unités de connaissance structurées (sections, blocs thématiques...).
  • Enrichissement des unités avec des métadonnées : source, date, typologie, thématique.
  • Conception et documentation d’un format pivot standardisé (Markdown enrichi ou JSON).
  • Rédaction d’une documentation claire des choix de structuration et du format utilisé.
  • Collaboration étroite avec l’équipe Knowledge Management pour affiner les modèles de structuration.
  • Mise en place d’un pipeline automatisé réutilisable pour le traitement de nouveaux documents.

Compétences techniques requises

  • Très bonne maîtrise du traitement de documents non structurés : parsing, OCR, nettoyage de texte.
  • Solide expérience en NLP (Natural Language Processing) et structuration de texte.
  • Connaissance des outils et bibliothèques Python : pdfminer, python-docx, BeautifulSoup, spaCy, Tesseract, etc.
  • Maîtrise de la conception de pipelines de traitement automatisés .
  • Rigueur dans la documentation et la standardisation des livrables.
  • Excellentes capacités d’analyse, de structuration et d’autonomie.
  • Vous avez un diplôme d'ingénieur, ou diplôme bac + 5 équivalent
  • Vous avez au minimum de 3 ans d'expérience dans l'informatique.
  • Connaissance de la plateforme Domino Data Lab.

Ce que nous offrons

  • Une mission stratégique au sein d’un grand groupe bancaire innovant.
  • Un projet à fort impact autour de l’intelligence artificielle et de la gestion de connaissance.
  • Environnement stimulant, en lien direct avec les équipes métier et data.
  • Cadre de travail à Nantes , avec possible flexibilité sur le rythme.

Descriptif de l’entreprise :

Meritis est un cabinet de conseil, pilotage et développement IT fondé en 2007 présent à Paris, Sophia-Antipolis, Aix-en-Provence, Montpellier, Toulouse, Nantes... Et bientôt sur de nouveaux territoires ! Notre mission ? Connecter les meilleurs talents aux entreprises pour leur donner un temps d’avance.

Nous accompagnons nos clients dans l’intégralité de leurs besoins en transformation numérique à travers de nombreux domaines d’expertises : Software Engineering, Finance, Pilotage de projets, Devops, Data, Cloud, Cybersécurité ou encore Agilité.

Intervenant aussi bien dans les secteurs de la Banque, de l'Assurance, des Télécommunications que de l'Industrie ou des Transports, aujourd'hui 40% des entreprises du CAC40 sont clientes Meritis.

Fort de nos valeurs d’exigence, d’humilité, de bienveillance et de proximité, nous comptons aujourd’hui plus de 900 collaborateurs.

Nous mettons un point d’honneur à être proche de nos collaborateurs et à les accompagner de manière individualisée quelles que soient leurs fonctions dans l’entreprise. Certifiée Great Place To Work depuis 2013, notre conception du bien-être au travail va bien au-delà d'un simple label, ce sont nos collaborateurs qui en parlent le mieux :

Devenir collaborateur Meritis c’est :

· Des parcours professionnels sur mesure (évolution de carrière, formations adaptées, mentoring…)

· Avoir le choix de sa mission et un accompagnement personnalisé tout au long de votre carrière ;

· Evoluer dans un environnement où l’apprentissage est favorisé : formations certifiantes, e-learning, meetUp, concours de code, parcours d’évolutions etc ;

· Faire partie de communautés d’experts qui partagent leurs savoirs et expériences au sein de nos centres de compétences ;

· Un environnement convivial avec de nombreux événements festifs (soirée annuelle, séminaires & teambuiding, déjeuners et afterworks…) ;

Vos différences sont nos atouts. C’est pourquoi Meritis est engagée en faveur de la diversité et de la non-discrimination. Tous nos métiers sont accessibles aux personnes en situation de handicap. Si vous avez une question ou pensez être victime ou témoin d’une discrimination, vous pouvez contacter [emailprotected] . »

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.