Activez les alertes d’offres d’emploi par e-mail !

Data Scientist NLP [F/H]

JR France

Pays de la Loire

Sur place

EUR 45 000 - 60 000

Plein temps

Il y a 9 jours

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Une entreprise innovante recherche un Data Scientist NLP afin de travailler sur des projets stratégiques de gestion de connaissances. Basé à Nantes, vous serez responsable de l'extraction et de la structuration des données issues de documents hétérogènes, en utilisant des technologies avancées comme Python et diverses bibliothèques. Si vous êtes passionné par l'intelligence artificielle et souhaitez contribuer à des projets à fort impact, cette opportunité est faite pour vous.

Prestations

Environnement stimulant et innovant
Collaboration avec des experts
Possibilité de flexibilité sur le rythme de travail

Qualifications

  • Expérience en extraction, nettoyage et structuration de données issues de documents variés.
  • Solide compétences en NLP et traitement de documents.
  • Autonomie et excellente capacité d'analyse.

Responsabilités

  • Conception et documentation de pipelines d'extraction et de structuration de contenu.
  • Collaboration avec l'équipe Knowledge Management pour affiner les modèles.
  • Mise en place d'un pipeline automatisé pour le traitement de nouveaux documents.

Connaissances

Traitement de documents non structurés
NLP (Natural Language Processing)
Analyse
Documentation
Collaboration

Formation

Bac + 5 ou diplôme d'ingénieur

Outils

pdfminer
python-docx
BeautifulSoup
spaCy
Tesseract
Domino Data Lab

Description du poste

Data Scientist NLP [F/H], pays de la loire

pays de la loire, France

Contexte du poste :

Dans le cadre de l’accélération de l’intelligence artificielle au sein d'une banque commerciale, nous recherchons un(e) ingénieur(e) data spécialisé(e) en traitement de documents pour une mission sur site à Nantes .

Ce projet s'inscrit dans un chantier stratégique de Knowledge Management (KM) visant à créer une base de connaissance centralisée, à partir de documents non structurés (PDF, Word, HTML). L’objectif est de formaliser la connaissance de manière standardisée et réutilisable à long terme, indépendamment des cas d’usage spécifiques.

Objectif de la mission

Concevoir un pipeline complet d’extraction, de nettoyage et de structuration de contenus textuels issus de documents hétérogènes, afin de les organiser dans un format pivot enrichi (Markdown ou JSON).

Vos principales activités

  • Extraction du texte depuis des fichiers PDF, Word, HTML via des librairies adaptées.
  • Nettoyage et normalisation des contenus (suppression de bruit, traitements OCR si nécessaire).
  • Segmentation des textes en unités de connaissance structurées (sections, blocs thématiques...).
  • Enrichissement des unités avec des métadonnées : source, date, typologie, thématique.
  • Conception et documentation d’un format pivot standardisé (Markdown enrichi ou JSON).
  • Rédaction d’une documentation claire des choix de structuration et du format utilisé.
  • Collaboration étroite avec l’équipe Knowledge Management pour affiner les modèles de structuration.
  • Mise en place d’un pipeline automatisé réutilisable pour le traitement de nouveaux documents.

Compétences techniques requises

  • Très bonne maîtrise du traitement de documents non structurés : parsing, OCR, nettoyage de texte.
  • Solide expérience en NLP (Natural Language Processing) et structuration de texte.
  • Connaissance des outils et bibliothèques Python : pdfminer, python-docx, BeautifulSoup, spaCy, Tesseract, etc.
  • Maîtrise de la conception de pipelines de traitement automatisés .
  • Rigueur dans la documentation et la standardisation des livrables.
  • Excellentes capacités d’analyse, de structuration et d’autonomie.
  • Vous avez un diplôme d'ingénieur, ou diplôme bac + 5 équivalent
  • Vous avez au minimum de 3 ans d'expérience dans l'informatique.
  • Connaissance de la plateforme Domino Data Lab.

Ce que nous offrons

  • Une mission stratégique au sein d’un grand groupe bancaire innovant.
  • Un projet à fort impact autour de l’intelligence artificielle et de la gestion de connaissance.
  • Environnement stimulant, en lien direct avec les équipes métier et data.
  • Cadre de travail à Nantes , avec possible flexibilité sur le rythme.

Descriptif de l’entreprise :

Meritis est un cabinet de conseil, pilotage et développement IT fondé en 2007 présent à Paris, Sophia-Antipolis, Aix-en-Provence, Montpellier, Toulouse, Nantes... Et bientôt sur de nouveaux territoires ! Notre mission ? Connecter les meilleurs talents aux entreprises pour leur donner un temps d’avance.

Nous accompagnons nos clients dans l’intégralité de leurs besoins en transformation numérique à travers de nombreux domaines d’expertises : Software Engineering, Finance, Pilotage de projets, Devops, Data, Cloud, Cybersécurité ou encore Agilité.

Intervenant aussi bien dans les secteurs de la Banque, de l'Assurance, des Télécommunications que de l'Industrie ou des Transports, aujourd'hui 40% des entreprises du CAC40 sont clientes Meritis.

Fort de nos valeurs d’exigence, d’humilité, de bienveillance et de proximité, nous comptons aujourd’hui plus de 900 collaborateurs.

Nous mettons un point d’honneur à être proche de nos collaborateurs et à les accompagner de manière individualisée quelles que soient leurs fonctions dans l’entreprise. Certifiée Great Place To Work depuis 2013, notre conception du bien-être au travail va bien au-delà d'un simple label, ce sont nos collaborateurs qui en parlent le mieux :

Devenir collaborateur Meritis c’est :

· Des parcours professionnels sur mesure (évolution de carrière, formations adaptées, mentoring…)

· Avoir le choix de sa mission et un accompagnement personnalisé tout au long de votre carrière ;

· Evoluer dans un environnement où l’apprentissage est favorisé : formations certifiantes, e-learning, meetUp, concours de code, parcours d’évolutions etc ;

· Faire partie de communautés d’experts qui partagent leurs savoirs et expériences au sein de nos centres de compétences ;

· Un environnement convivial avec de nombreux événements festifs (soirée annuelle, séminaires & teambuiding, déjeuners et afterworks…) ;

Vos différences sont nos atouts. C’est pourquoi Meritis est engagée en faveur de la diversité et de la non-discrimination. Tous nos métiers sont accessibles aux personnes en situation de handicap. Si vous avez une question ou pensez être victime ou témoin d’une discrimination, vous pouvez contacter [emailprotected] . »

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.