Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Data Scientist Senior

Degetel

Paris

Sur place

EUR 50 000 - 70 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise de technologie avancée recherche un Data Scientist pour contribuer à des projets innovants autour de l'analyse automatique de contenus audio et textuels. Le candidat idéal aura au moins 4 ans d'expérience dans le domaine, notamment en audio, et fera preuve d'autonomie et de curiosité scientifique. Il/elle travaillera avec les équipes produit, éditoriales et techniques afin de développer des modèles de Machine Learning et participer à des recherches appliquées sur des topics tels que la détection de fakes audio et l'extraction de métadonnées.

Qualifications

  • Au moins 4 ans d'expérience en data science, avec une spécialisation en audio.
  • Curiosité scientifique et esprit d’innovation.
  • Capacité à vulgariser et présenter des résultats à des publics non techniques.

Responsabilités

  • Concevoir et développer des modèles pour l’analyse de contenus audio et textuels.
  • Assurer une veille scientifique et technologique dans le domaine.
  • Documenter et présenter les travaux réalisés en interne et en externe.

Connaissances

Traitement du signal audio
Machine Learning / Deep Learning
Python
MLOps

Outils

NumPy
PyTorch
TensorFlow
scikit-learn
Description du poste

Le/la Data Scientist interviendra sur des projets autour de l’analyse automatique de contenus audio (en axe majeur) et textuels (en axe secondaire), en lien étroit avec les équipes produit, éditoriales et techniques.

Missions principales

  • Concevoir et développer des modèles de Machine Learning / Deep Learning pour l’analyse de contenus audio et textuels.
  • Travailler sur des projets tels que :
  • Extraction automatique de métadonnées musicales
  • Détection de fakes audio et contenus synthétiques pour aider les journalistes, et au delà contribuer à la fiabilité de l'information d'un média public
  • Extraction de métadonnées à partir des podcasts ou contenus vidéo, comme les émotions, les jingles, le repérage des parties musicales, etc.
  • Réaliser l’exploration, l’annotation et la structuration de jeux de données audio et texte.
  • Prototyper, entraîner et évaluer des modèles (POC, benchmarks, analyses comparatives).
  • Assurer une veille scientifique et technologique (audio ML, speech, NLP).
  • Documenter et présenter nos travaux en interne et à l’extérieur.

Compétences techniques clés

  • Traitement du signal audio : features acoustiques, spectrogrammes, embeddings audio
  • Machine Learning / Deep Learning : CNN, RNN, Transformers, auto-encodeurs
  • MLOps : automatisation d’un pipeline de production de données
  • Python et écosystème data (NumPy, PyTorch / TensorFlow, scikit-learn)
  • Expérience avec des datasets audio de grande taille et des problématiques bruit / qualité

Atouts appréciés

  • NLP : modèles de langage, classification de texte, embeddings, Transformers (BERT, Whisper, etc.)
  • Expérience en recherche appliquée ou projets R&D
  • Connaissance des problématiques médias, musique ou radio
  • Sensibilité aux enjeux éthiques (IA générative, deepfakes, biais)
  • Capacité à vulgariser et présenter des résultats à des publics non techniques
  • Intérêt pour la qualité du code (code review, bonnes pratiques de développement)

Qualités attendues

  • Curiosité scientifique et esprit d’innovation
  • Autonomie et rigueur méthodologique
  • Goût pour le travail collaboratif et pluridisciplinaire
  • Intérêt marqué pour les contenus audio et culturels

L’équipe de R&D à la direction du numérique ne prend pas en charge l’industrialisation des algorithmes qu’elle conçoit.

Aspects primordiaux :

  • Nous cherchons une personne motivée, curieuse, autonome et bonne communicante pour être à l'aise sur des travaux exploratoires dans une équipe de R&D
  • La personne doit avoir au moins 4 ans d'expérience en data science, avec une partie importante en audio. Nous préférerons cependant la motivation à la séniorité
  • Nous privilégions la qualité de l’équipe et du collectif. Le savoir être et l’adaptabilité constitueront un critère essentiel
Créer une alerte emploi pour cette recherche
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.