Activez les alertes d’offres d’emploi par e-mail !

Senior Data Scientist NLP/GenAI - Catalog

Mirakl - Labs

Paris

Sur place

EUR 45 000 - 60 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Résumé du poste

Une entreprise technologique recherche un Data Scientist pour prototyper et mettre en production des algorithmes, en se concentrant sur le catalogue Marketplace. Le candidat idéal a au moins 4 ans d'expérience en NLP et Machine Learning, et travaille avec des outils comme Python, Tensorflow et Spark. Le poste offre une grande autonomie et un impact visible sur des sites e-commerce dans 40 pays.

Qualifications

  • 4 ans d'expérience minimum en tant que Data Scientist.
  • Expérience en NLP et Machine Learning.
  • Mise en production d'algorithmes de Machine Learning requise.

Responsabilités

  • Prototyper, itérer, et mettre en production des algorithmes.
  • Collaborer avec les équipes Produit et Data Engineers.
  • Analyser et préparer les données.

Connaissances

NLP
Machine Learning
Computer Vision
Python
Spark

Outils

Tensorflow
Pytorch
Databricks
AWS
SQL
Description du poste

Mirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activité digitale afin d'accélérer de façon durable et rentable leur croissance.

Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media.

Mirakl est le partenaire de choix de plus de 450 entreprises leaders dans le monde, dont Airbus, Maisons du Monde, Decathlon, H&M, Sonepar et Toyota Material Handling.

Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie…

Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services).

Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.

A propos du job

Intégré.e dans notre équipe Data Science, votre principale mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement.

Vos projets seront centrés sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle.

Sujets catalogue :

  • Réécriture automatique du contenu Marketing en fonction des attentes métier
  • Extraction d’attributs produit à partir d’image et de texte libre
  • Détection de produits variants
  • Catégorisation de produits
  • Onboarding automatique des produits vendeurs
  • Fusion de fiches produits provenant de sources multiples
  • Prédiction de produits tendance

Ce qu’il y a pour vous dans ce job :

  • Implémenter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumétrie très importantes (millions de produits, de clients, de commandes par an)
  • Des techniques de pointe variées (modèles multimodaux, fine-tuning de LLM, etc.)
  • Une vraie autonomie et responsabilité dans les projets dont vous avez ownership

Notre stack et nos outils

Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake.

Au quotidien, vous allez :

  • Analyser, préparer les données, prototyper des algorithmes
  • Les mettre en production en collaboration avec les Data Engineers et les équipes de développement
  • Faire des dashboards afin d’illustrer la pertinence des algorithmes et de monitorer la production
  • Présenter les résultats au weekly data science et participer aux sessions de brainstorming de l’équipe
  • Échanger avec les autres équipes pour affiner les cas d’utilisation, l’expérience utilisateur et les modes d’intégration

Vous aimerez ce job si :

  • Vous avez 4 ans d'expérience minimum en tant que Data Scientist, avec une expérience significative en NLP et ML appliqué en entreprise
  • Vous avez déjà mis en production des algorithmes de Machine Learning
  • Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art
  • Vous avez une expérience en développement Spark
  • Vous êtes pragmatique, data-driven et orienté métier
  • Vous aimez avoir l’ownership de vos sujets et vous êtes autonome et avez un très bon esprit d’équipe

Mirakl est engagée en faveur de la diversité, de l’égalité des chances et de l’inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.