Activez les alertes d’offres d’emploi par e-mail !

APPRENTISSAGE : Data scientist (F/H) | Paris, FR | Hybride

Caisse des Dépôts et Consignations

Paris

Sur place

EUR 40 000 - 70 000

Plein temps

Il y a 30+ jours

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Rejoignez une institution publique dynamique et engagée, où vous utiliserez vos compétences en data science et intelligence artificielle pour contribuer à des missions d'intérêt général. Vous intégrerez une équipe motivée et travaillerez sur des projets innovants, exploitant des technologies avancées pour transformer les politiques sociales. Ce rôle vous permettra de mettre en pratique vos connaissances en machine learning et deep learning, tout en contribuant à des solutions qui répondent aux enjeux sociétaux. Une occasion unique de faire une différence dans un environnement collaboratif et stimulant vous attend.

Qualifications

  • Maîtrise des langages Python, SQL et PySpark.
  • Compétences en Machine Learning et Deep Learning.
  • Connaissances en text mining et speech-to-text.

Responsabilités

  • Définir et implémenter le preprocessing des données non structurées.
  • Optimiser les traitements en termes de performance machine.
  • Présenter les approches proposées et documenter les résultats.

Connaissances

Python
SQL
PySpark
Machine Learning
Deep Learning
Text Mining
Speech-to-Text

Formation

Diplôme d'une grande école d'ingénieur
Troisième cycle universitaire en data science
Mathématiques appliquées
Statistiques

Outils

Hadoop
Spark
Hive
MongoDB
Pig

Description du poste

Missions et activités principales
LE MOT DU MANAGER

Vous êtes passionné(e) par la data, l'intelligence artificielle et les algorithmes (machine learning, deep learning, NLP, etc.), ainsi que par des sujets d'intérêt général tels que l'explicabilité et la fairness. Rejoignez-nous pour mettre vos compétences au service de l'intérêt général. Vous intégrerez une équipe motivée, dynamique, dans un environnement de travail agréable.

DESCRIPTION DE L'ENTITÉ
Etablissement financier public, nous remplissons des missions d’intérêt général en soutien des politiques publiques. Depuis plus de 200 ans, nous jouons un rôle majeur dans la transformation de notre pays, notamment dans la réduction des inégalités territoriales et sociales, et la lutte contre le changement climatique.

Vous participerez à la transformation de la Direction des politiques sociales par l'usage de nouvelles technologies et de l'intelligence artificielle, apportant des innovations à nos services. Vous valoriserez l'utilisation du numérique, Data & IA pour répondre aux enjeux de la Direction des Politiques sociales (DPS).

Vous serez rattaché(e) au Service Numérique DATA et IA de la Direction de l'innovation et de la prospective, sous la supervision du Lead data scientist de la DPS.

MISSIONS

  1. Définir et implémenter le preprocessing des données non structurées (textes, catalogue de formations, référentiel de compétences et métiers) pour modéliser leur extraction et retraitement algorithmique dans la plateforme data.
  2. Optimiser les traitements en termes de performance machine et de performance statistique.
  3. Détecter les entités nommées dans un corpus documentaire volumineux.
  4. Sélectionner les techniques adéquates et construire les solutions pour traiter les données non structurées selon les besoins.
  5. Définir une stratégie pour identifier les meilleurs modèles et répondre aux problématiques.
  6. Présenter de manière pédagogique les approches proposées et documenter les résultats avec une documentation technique et un mode opératoire.
Vous participerez activement à la mise en œuvre des cas d'usage data et usages avancés. Vous travaillerez sur plusieurs projets internes de data science sous la supervision du chef de projet, avec des missions variées.

Profil attendu
Le recrutement à la Caisse des Dépôts est basé sur les compétences, sans distinction d'origine, d'âge ou de genre. Tous nos postes sont ouverts aux personnes en situation de handicap.

Connaissances souhaitées
  • Maîtrise des langages Python, SQL et PySpark.
  • Compétences en Machine learning et Deep learning.
  • Connaissances en textmining, speech-to-text.
  • Connaissance des outils de gestion de données (SQL, NoSQL) et des architectures Big Data (Hadoop, Spark, Hive, MongoDB, Pig).

Diplôme en cours de préparation : Diplôme d'une grande école d'ingénieur ou d'un troisième cycle universitaire en data science, mathématiques appliquées ou statistiques.

Qualités personnelles
Notre organisation valorise le travail collaboratif. Vous apporterez :

  • Engagement fort et autonomie en équipe.
  • Capacité d'adaptation à divers enjeux et interlocuteurs.
  • Gestion simultanée de plusieurs sujets en mode projet.
  • Respect de la confidentialité.
  • Esprit d'initiative, force de proposition.
  • Respect des délais et priorités.
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.