Activez les alertes d’offres d’emploi par e-mail !

Data Scientist F / H

Caisse de Depots

Paris

Sur place

EUR 45 000 - 65 000

Plein temps

Il y a 2 jours
Soyez parmi les premiers à postuler

Résumé du poste

Une institution publique française recherche un Data Scientist à Paris pour réaliser des analyses en machine learning et mettre en œuvre des outils d'IA. Le candidat idéal a un BAC+5 en science, une solide expérience en modélisation et une maîtrise des LLM. Ce rôle offre des opportunités de développement professionnel dans un environnement dynamique. Temps complet, poste basé à Paris.

Qualifications

  • Solide expérience en modélisation et machine learning.
  • Utilisation avérée des LLM et bibliothèques associées.
  • Connaissance des dernières évolutions en IA et deep learning.
  • Capacité à construire des solutions opérationnelles.

Responsabilités

  • Réaliser études et analyses en machine learning.
  • Mise en œuvre d'algorithmes de text mining.
  • Prétraitement des documents.
  • Exploitation de bases de données en open data.

Connaissances

Modélisation / mathématiques appliquées
Machine learning
Utilisation de LLM
Programmation Python
TensorFlow
Scikit-learn
Pandas
Numpy

Formation

BAC+5 en formation scientifique

Outils

Bitbucket
Docker
Description du poste
Missions et activités principales

Au sein de la Direction des prêts de la Banque des Territoires, en tant que Data Scientist vous serez à titre principal amené à réaliser divers études / analyses et à mettre en œuvre divers outils de machine learning. Vous pourrez être amené, ponctuellement et lorsque cela sera nécessaire, à participer à l'activité de production de données du service.

Les missions à réaliser seront variées :

  • Mise en œuvre d'algorithmes de text mining et de traitement du langage sur les différents documents à disposition de la direction des prêts (pièces justificatives des clients, etc.)
  • Extraction automatique d'informations
  • Classification de documents
  • Amélioration de la qualité des données

Pour cela, la connaissance de différentes approches statistiques, dont l'utilisation de réseaux de neurones, est nécessaire. La mise en œuvre de ces techniques permettra, par exemple, de constituer automatiquement des bases de données pour fiabiliser les données de la DP et les enrichir d'informations supplémentaires. Vous participerez activement au développement de services destinés aux clients de la Direction, sur la base de ce type de technologies.

Travaux à réaliser sur les modèles larges de langage et sur l'ensemble de l'architecture liée à ces solutions :

  • Mise en œuvre du RAG, des solutions de type agent
  • Prétraitement des documents
  • Test et utilisation de différents LLM

Participation à l'industrialisation et à la bonne mise en œuvre de l'ensemble des outils de data sciences utilisées à DPHD80. Code sur Bitbucket, documentation des outils, mise en œuvre de packages, utilisation de Docker

Analyse / collecte de données :

  • Exploitation de bases de données en open data afin d'enrichir la connaissance client (base SQL, fichiers Parquet)
  • Récupération d'informations par web scraping
Profil attendu

Le recrutement à la Caisse des Dépôts est fondé sur les compétences, sans distinction d'origine, d'âge, ni de genre. Tous nos postes sont ouverts aux personnes en situation de handicap.

Vous avez :

  • Une formation scientifique supérieure (BAC+5)
  • Une solide expérience en modélisation / mathématiques appliquées et machine learning
  • Une utilisation avérée de LLM et des librairies liées (déploiement de petits LLM en local)
  • Une expérience avérée en estimation de modèle de Deep learning et en fine tuning de ces modèles (Bert).
  • Bonne maîtrise des dernières évolutions dans le domaine de l'IA et du deep learning.
  • un savoir-faire en mise en œuvre des outils d'IA dans le domaine du traitement du texte, de l'image et de données plus classiques.
  • Excellente connaissance de la programmation en particulier python et les librairies tensorflow, scikitlearn, pandas, numpy
  • Capacité à construire des solutions opérationnelles et industrialisables pertinentes
Qualités personnelles attendues :

Vous disposez des capacités personnelles suivantes :

  • Qualités d'analyse, de synthèse et de rédaction
  • Bonnes qualités relationnelles
  • Curiosité, rigueur, autonomie, capacité à faire des propositions innovantes
Conditions de travail

Poste basé à Paris 72 avenue Pierre Mendes France

Temps de travail : Temps complet

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.