Activez les alertes d’offres d’emploi par e-mail !

Stage - assistant data scientist - développement de systèmes rag agentiques H/F

Crédit Agricole SA

Montrouge

Sur place

EUR 40 000 - 60 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Résumé du poste

Une grande entreprise bancaire à Montrouge recherche un stagiaire assistant data scientist pour participer au développement de solutions innovantes en intelligence artificielle. Le candidat travaillera sur la plateforme CA Generative Search, en améliorant des fonctionnalités d'agents pour des recherches complexes. Une solide formation en data science, NLP et développement logiciel est requise. Le stage se déroulera dans un environnement dynamique avec un encadrement d'experts.

Qualifications

  • Formation en data science avec une dominante en NLP, deep learning, développement logiciel.

Responsabilités

  • Développer des architectures d'agents pour orchestrer des recherches complexes.
  • Implémenter des capacités de self-réflexion et de correction automatique des réponses.
  • Intégrer des outils externes dans le processus de raisonnement agentique.

Connaissances

Traitement de langage naturel (NLP)
Deep learning
Développement logiciel

Formation

Université ou école d'ingénieur en data science
Description du poste
Stage - assistant data scientist - développement de systèmes rag agentiques H/F

Au sein de la Direction de la Transformation Technologique Data & IA (TEC), la Direction Data & IA Groupe a pour ambition de maximiser la contribution de la Data et de l’Intelligence Artificielle au fonctionnement du Crédit Agricole. Elle s’appuie notamment pour cela sur le DataLab Groupe pôle de référence en conception interne de solutions Data & IA innovantes et industrielles en partenariat avec les entités du Groupe.

Le DataLab Groupe dispose de toutes les compétences Data coopérant au sein de Squads pluridisciplinaires selon une méthode interne d’inspiration Agile :

  • Data & AI Engineering visant à préparer les données, définir les architectures, infrastructures et « packager » les solutions qui y seront déployées pour intégration dans le SI
  • Data Science Analytique et Sémantique pour concevoir des algorithmes d’Intelligence Artificielle basés sur l’open source exploitant respectivement des données structurées (tabulaires) et des données non structurées (texte, image, voix, vidéos) afin de répondre aux besoins exprimés par les métiers des entités du Groupe
  • Gestion de projets qui avec l’ensemble des partenaires et équipes techniques du DataLab Groupe, permet d'identifier et étudier les opportunités, cadrer les projets et en coordonner la réalisation

L'objectif du stage est d'améliorer la plateforme interne de Retrieval Augmented Generation (RAG), appelée CA Generative Search (CAGS) déjà déployée en production pour de multiples métiers, en participant aux développements de nouvelles fonctionnalités agentiques.

  • Développer des architectures d'agents pour orchestrer des recherches complexes multi-étapes
  • Investiguer les mécanismes de planification et de raisonnement pour améliorer la qualité des réponses
  • Implémenter des capacités de self-réflexion et de correction automatique des réponses
  • Intégrer des outils externes dans le processus de raisonnement agentique

Après avoir réalisé un état de l'art spécifique à chaque axe de travail, le stagiaire devra comparer les différentes pistes d'amélioration afin de sélectionner les plus pertinentes, avant d'intégrer ses travaux à CAGS, conjointement avec un stagiaire travaillant sur les aspects de Data & AI Engineering. Le défi est particulièrement relevé compte tenu des exigences d’industrialisation et de sécurité inhérentes au système d’information d’une banque.

Organisation et livrables

Dans l’objectif de livrer des fonctionnalités intégrables au sein des solutions industrielles en production, les stages se déroulent sous l’encadrement d’experts IA au sein d’une Squad pluridisciplinaire ayant comme référent fonctionnel un chef de projet IA, et selon la méthode Projet du DataLab Groupe qui fait l’objet d’une certification IA de confiance et d’une labélisation RSE.

Le stagiaire aura accès à des environnements d’engineering industriel puissants et à l’état de l’art, en local et dans le cloud.

Qualifications

Université, école d'ingénieur avec une formation data science avec une dominante traitement de langage naturel (NLP), deep learning et développement logiciel.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.