Activez les alertes d’offres d’emploi par e-mail !

Data Scientist F/H

Groupe Caisse des Dépôts

Paris

Sur place

EUR 45 000 - 60 000

Plein temps

Il y a 12 jours

Résumé du poste

Une institution financière française recherche un Data Scientist pour réaliser des études et mettre en œuvre des outils de machine learning. Vous travaillerez sur l'amélioration de la qualité des données et l'extraction d'informations à partir de documentations variées. Une bonne connaissance des statistiques et des outils de data science est essentielle, avec un environnement de travail basé sur Docker et Bitbucket.

Qualifications

  • Expérience en Data Science, particulièrement avec le machine learning.
  • Connaissance des approches statistiques nécessaires pour les modèles prédictifs.
  • Compréhension des bases de données et du web scraping.

Responsabilités

  • Réaliser des études et analyses en Data Science.
  • Mettre en œuvre des algorithmes de machine learning sur des documents.
  • Industrialiser les outils de data science utilisés.

Connaissances

Algorithmes de text mining
Traitement du langage naturel
Statistiques avancées
Réseaux de neurones
Web scraping

Outils

Docker
Bitbucket
SQL
Fichiers Parquet
Description du poste
Overview

Au sein de la Direction des prêts de la Banque des Territoires, en tant que Data Scientist vous serez à titre principal amené à réaliser divers études / analyses et à mettre en œuvre divers outils de machine learning. Vous pourrez être amené, ponctuellement et lorsque cela sera nécessaire, à participer à l'activité de production de données du service.

Responsabilités

Les missions à réaliser seront variées :

  • Mise en œuvre d'algorithmes de text mining et de traitement du langage sur les différents documents à disposition de la direction des prêts (pièces justificatives des clients) :
  • Extraction automatique d'informations
  • Classification de documents
  • Amélioration de la qualité des données

Pour cela, la connaissance de différentes approches statistiques, dont l'utilisation de réseaux de neurones, est nécessaire. La mise en œuvre de ces techniques permettra, par exemple, de constituer automatiquement des bases de données pour fiabiliser les données de la DP et les enrichir d'informations supplémentaires. Vous participerez activement au développement de services destinés aux clients de la Direction, sur la base de ce type de technologies.

Travaux à réaliser sur les modèles larges de langage et sur l’ensemble de l’architecture liée à ces solutions :

  • Mise en œuvre du RAG, des solutions de type agent
  • Prétraitement des documents
  • Test et utilisation de différents LLM

Participation à l’industrialisation et à la bonne mise en œuvre de l’ensemble des outils de data sciences utilisées à DPHD80. Code sur Bitbucket, documentation des outils, mise en œuvre de packages, utilisation de Docker

Analyse / collecte de données
  • Exploitation de bases de données en open data afin d’enrichir la connaissance client (base SQL, fichiers Parquet)
  • Récupération d’informations par web scraping
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.