Activez les alertes d’offres d’emploi par e-mail !

[APPRENTISSAGE] - Data Scientist (F / H) - Caisse des Dépôts et Consignations

Caisse des Dépôts et Consignations

Paris

Sur place

EUR 40 000 - 70 000

Plein temps

Il y a 30+ jours

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Rejoignez une équipe dynamique au sein d'un établissement financier public, où vous appliquerez vos compétences en machine learning et en programmation pour des projets d'intérêt général. Vous serez impliqué dans le développement d'outils innovants pour optimiser les activités de prêt, tout en contribuant à la réduction des inégalités et à la lutte contre le changement climatique. Ce rôle vous permettra de travailler sur des données massives et d'utiliser des technologies avancées telles que l'apprentissage automatique et le traitement du langage naturel. Si vous êtes passionné par l'analyse de données et souhaitez avoir un impact positif, cette opportunité est faite pour vous.

Qualifications

  • Formation scientifique en machine learning, de préférence un Master 2.
  • Expérience en programmation Python et en machine learning.

Responsabilités

  • Développer des outils quantitatifs pour l'activité de prêt.
  • Améliorer la qualité des données et créer des rapports statistiques.

Connaissances

Machine Learning
Python
Webscraping
Data Analysis

Formation

Master 2 en Machine Learning
École d'ingénieur

Outils

Python Libraries (Data Science)
OCR Technologies
NLP Models (CamemBERT)

Description du poste

Au sein d'une équipe de Data Scientists dynamique et experte, vous aurez l'opportunité de mettre en pratique vos connaissances en machine learning et en programmation, au service de l'intérêt général.

Etablissement financier public, nous remplissons des missions d'intérêt général en appui des politiques publiques. Depuis plus de 200 ans, nous jouons un rôle majeur dans la transformation de notre pays. La réduction des inégalités territoriales et sociales, la lutte contre le changement climatique...sont autant de défis auxquels notre pays fait face et pour lesquels nous nous mobilisons aujourd'hui, plus que jamais.

Présentation de la Direction / Service / Département / Direction régionale / l'équipe

La Direction des prêts a la charge de la structuration et du déploiement des prêts sur épargne réglementée en France. Avec 28,5Mds€ de prêts accordés en 2024 ; avec un volume industriel de données et pièces associés à ces prêts, la data joue un rôle central dans l'activité.

Au sein de la direction des prêts, le service Pilotage et Statistique a pour mission de valoriser les données nécessaires au pilotage de l'activité de prêt en construisant des outils statistiques innovants pour la décision, destinés à permettre une vision 360 sur l'activité globale de prêt.

Il est chargé notamment de réaliser et de mettre en œuvre :

  1. Le développement d'approches et d'outils quantitatifs de pointe ( machine learning - deep learning - économétrie avancée) afin d'éclairer ou faciliter l'activité opérationnelle de prêt.
  2. Appuie au pilotage stratégique de l'activité préteur ;
  3. Participation à l'amélioration de la qualité des données et à l'alimentation de différents rapports et tableaux de bord ;
  4. Prévision des activités de prêt (de la signature du prêt au versement du prêt), alimentant notamment la fixation des objectifs des directions régionales

La Banque des Territoires accorde ainsi chaque année des prêts aux bailleurs sociaux pour la construction d'environ 90 000 logements sociaux et la rénovation de 110 000 autres. Chacune de ces demandes de prêt nécessite de nombreuses pièces justificatives de la part de l'emprunteur, qui doivent ensuite être contrôlées et validées par les instructeurs et contrôleurs. Afin de les aider et leur faire gagner en temps et en fiabilité, nous avons développé un outil d'aide automatique au contrôle de premier niveau des délibérations de garantie d'emprunt délivrées par la collectivité garante. Cet outil utilise plusieurs briques technologiques autour du traitement automatique du langage (NLP) :

  • Transformation d'images en texte (OCR) : Réseaux de neurones convolutifs (RNC) spécifiques développés par l'équipe Data Science.
  • Extraction des informations concernant le contrat de prêt, l'emprunteur et le garant avec un modèle de reconnaissance d'entités nommées (NER) (modèle de langage CamemBERT ré-entrainé sur nos données)
  • Interprétation de phrases juridiques légales avec un algorithme de similarité de phrases développé à partir du modèle CamemBERT pour proposer des phrases qui ne sont pas exactement celles attendues.

Vous participerez activement à :

  • Préparation et mise en qualité des données utilisées ;
  • Développement d'applications en python, entrainement et utilisation de modèles : mise en œuvre, tests et analyses de performance ;
  • En s'appuyant sur les briques déjà développées dans le cadre des garanties d'emprunt, une des missions consistera à contribuer à développer un outil similaire pour un ensemble large d'autres documents bancaires ;
  • D'autres missions ayant pour objectif d'aider les collaborateurs dans les processus de prospection et de communication avec les clients seront également proposées, notamment :

Développer et mettre en œuvre des techniques de webscraping pour la récupération automatique de données et documents externes d'intérêt métier.

Dès lors que les résultats font la démonstration de leur qualité, les travaux réalisés pourront le cas échéant être mis en production dans le cadre de l'activité opérationnelle d'octroi de prêts d'intérêt général ; participant à son échelle à cette activité.

Le recrutement à la Caisse des Dépôts est fondé sur les compétences, sans distinction d'origine, d'âge, ni de genre. Tous nos postes sont ouverts aux personnes en situation de handicap.

  • De formation scientifique, en école d'ingénieur, Master 2, spécialisé en machine learning ;
  • Vous maitrisez python et les principales librairies utilisées en data science ; Vous avez déjà pratiqué le Machine Learning dans ce langage ;
  • Vous êtes à l'aise avec l'exploitation de vaste base de données ;

Connaissances Demandées

  • Expérience en programmation (Python)
  • Machine Learning
  • Une expérience passée, sous la forme de projets, autour du webscraping serait un plus

Qualités personnelles

Notre organisation est attachée à promouvoir au quotidien un mode de travail collaboratif. Au-delà, vous pourrez nous apporter...

Vous avez un sens poussé de l'analyse et êtes rigoureux. Vous possédez une appétence pour les modèles de langage. Vous êtes autonome et force de proposition pour le développement de projets opérationnels scientifiques à forts enjeux.

Conditions de travail

  • Rythme d'alternance souhaité (le cas échéant) : 2 à 3j par semaine en entreprise
  • Date de début de contrat d'apprentissage souhaitée : Septembre 2025
  • Localisation du poste : France, île de France à Paris : 72, avenue Pierre Mendès France 75013 Paris
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.