Activez les alertes d’offres d’emploi par e-mail !

Stagiaire assistant ia / data - rag hiérarchique H/F

Crédit Mutuel Arkéa

Brest

Sur place

EUR 20 000 - 40 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Résumé du poste

Une entreprise de technologie financière cherche un(e) stagiaire assistant(e) IA à Brest pour un stage de 6 mois. Vous étudierez des méthodes avancées de retrieval et participerez à des projets de recherche. Ce stage est une excellente opportunité pour les étudiants en dernière année d'école d'ingénieur avec des compétences en Python et Deep Learning.

Qualifications

  • Étudiant(e) en Master 2 ou dernière année d'École d'Ingénieur (Informatique, IA, Data Science, NLP).
  • Compétences solides en Python et dans un framework de Deep Learning majeur (PyTorch).
  • Un premier contact avec les systèmes RAG ou les bases de données vectorielles est un plus.

Responsabilités

  • Étudier les méthodes de retrieval denses et les techniques d'encodage de documents.
  • Conserver la représentation latente de chaque élément.
  • Mettre en œuvre le pipeline de recherche hiérarchique.

Connaissances

Python
Deep Learning (PyTorch)
Curiosité
Rigueur scientifique
Autonomie

Formation

Master 2 ou dernière année d'École d'Ingénieur

Outils

LangChain
LlamaIndex
Description du poste
Stagiaire assistant ia / data - rag hiérarchique H/F

Stage de 6 mois à pourvoir sur Brest à partir du 02/03/2026

État de l'art

Étudier les méthodes de retrieval denses (bi-encodeurs) et les techniques d'encodage de documents structurés (ex: modèles de layout-aware).

Modélisation & Implémentation
  • Conserver la représentation latente (embedding) de chaque "chunk" (élément fin).
  • Entraîner un modèle d'agrégation au niveau de la Page, qui produit un unique vecteur sémantique encapsulant tous les éléments qu'elle contient.
  • Entraîner un modèle d'agrégation au niveau du Document, qui produit un vecteur global encapsulant l'ensemble de ses pages.
Expérimentation
  • Mettre en œuvre le pipeline de recherche hiérarchique.
  • Évaluer rigoureusement la performance du retriever en utilisant notre benchmark interne déjà établi, basé sur une évaluation au niveau de la page.
  • Analyse & Synthèse : Comparer l'approche hiérarchique aux méthodes de RAG "plates" (flat RAG) et rédiger un rapport technique.
Qualifications
  • Étudiant(e) en Master 2 ou dernière année d'École d'Ingénieur (Informatique, IA, Data Science, NLP).
  • Compétences solides en Python et dans un framework de Deep Learning majeur (PyTorch).
  • Un premier contact avec les systèmes RAG (ex: LangChain, LlamaIndex) ou les bases de données vectorielles est un plus très apprécié.
  • Qualités : Rigueur scientifique, curiosité, autonomie et goût pour la R&D fondamentale.
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.