Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Data Scientist Stagiaire

Scalian

Toulouse

Sur place

EUR 80 000 - 100 000

Plein temps

Hier
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une société de conseil en ingénierie basée à Toulouse recherche un stagiaire Data Scientist pour un stage de 6 mois. Le candidat contribuera au développement de solutions innovantes utilisant des modèles de langage pour améliorer les tests fonctionnels. Des connaissances en Python et en modèles LLMs sont nécessaires. Ce stage offre une expérience précieuse au sein d'une entreprise en pleine croissance et labellisée 'Great Place to Work'.

Prestations

Programme d'onboarding complet
Formations personnalisées
Événements internes
Accord de télétravail
Prime de cooptation
Prime vacances

Qualifications

  • Vous êtes en dernière année de cursus BAC+5 en data science.
  • Connaissances en utilisation des modèles LLMs requises.
  • Vous êtes curieux, méthodique, rigoureux et autonome.

Responsabilités

  • Contribuer au développement d’un pipeline pour générer des tests fonctionnels.
  • Développer un système de RAG pour enrichir les stratégies de prompt.
  • Développer un système d’agents basés sur des LLMs pour les tests fonctionnels.

Connaissances

Connaissances en modèles LLMs
Python
Hugging Face Transformers
LangChain
AutoGen
MCP

Formation

BAC+5 en data science
Description du poste

Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois ?

Nous disposons au sein de chez Scalian d’un Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur l’ensemble de la France.

Contexte :

Les recherches sur l’utilisation des Grands Modèles de Langage (ou Large Language Models, LLMs) ont montré des résultats prometteurs dans la génération de code source ainsi que dans la création de cas de tests unitaires. Dans le domaine du software testing, l’un des défis encore non résolus consiste à exploiter les LLMs pour les activités précoces du cycle de vie des tests, telles que les tests fonctionnels. Malgré leurs succès initiaux, il n’est pas encore clairement établi quelle est l’efficacité réelle de ces modèles pour générer des tests fonctionnels conformes aux exigences.

SCALIAN Insights a mené plusieurs travaux visant à répondre à cette question, notamment en étudiant des facteurs tels que la stratégie de prompting (ou prompt engineering) et l’évaluation des tests générés sur des jeux de référence (benchmarks). La poursuite de ces travaux vise à explorer de nouvelles approches pour intégrer davantage de contexte - par exemple à partir de l’expression des besoins ou des spécifications fonctionnelles - en s’appuyant sur des techniques comme GraphRAG (Retrieval-Augmented Generation avec graphe de connaissances) ou encore sur la collaboration entre agents dotés de rôles spécifiques basés sur des LLMs (Mixture of Agents, MoA) et Model Contex Protocol (MCP).

[1] Junjie Wang et al., «Software Testing with Large Language Models: Survey, Landscape, and Vision» (arXiv, 4 mars 2024), http://arxiv.org/abs/2307.07221.

[2] Junlin Wang et al., «Mixture-of-Agents Enhances Large Language Model Capabilities» (arXiv, 7 juin 2024), http://arxiv.org/abs/2406.04692.

[3] https://modelcontextprotocol.io/docs/getting-started/intro

Vos missions s'articuleront autour des axes suivants :

  • Contribution au développement d’un pipeline pour générer des tests fonctionnels pour le framework Cypress avec des modèles LLMs
  • Développement d’un système de RAG pour enrichir les stratégies de prompt avec des documents fonctionnels (expression de besoins, spécifications fonctionnelles)
  • Développement d’un système d’agents basés sur des LLMs inspirés de l’architecture MoA appliqué à la génération de tests fonctionnels Cypress
Description de l'entreprise

Pourquoi feriez-vous le grand saut ?

Dans le TOP10 des Sociétés de Conseil en Ingénierie en France, le Groupe SCALIAN intervient sur des activités de services en management de projets industriels, supply chain, architecture et développement de systèmes numériques embarqués, applicatifs de systèmes d'information et d'Intelligence artificielle dans des secteurs d’activité aussi variés que l’aéronautique, le spatial, l’automobile, le ferroviaire, les services, le luxe ou le retail etc.

Créée en 1989, SCALIAN compte aujourd’hui plus de 5500 collaborateurs répartis dans 12 pays et 15 implantations en France pour un chiffre d’affaires de 550 millions d’euros. SCALIAN travaille pour des grands Groupes du CAC40 sur des projets en AT ou au forfait.

Labellisée Great Place to Work, SCALIAN connait une croissance de 20% chaque année.

Pourquoi SCALIAN ?
  • Parce que Scalian vous accompagne dans le développement de votre carrière : programme d'onboarding complet sur 1 an avec votre manager et votre RH, programmes de formation personnalisés, communautés techniques, événements internes
  • Parce que Scalian favorise la Qualité de Vie au Travail : certifications Great Place to Work® et Best Workplaces for Women, prime de cooptation, prime vacances, accord télétravail
  • Parce que Scalian développe une politique RSE concrète et ambitieuse : mobilité durable, actions environnementales, actionshandicap (accord agréé, processus de recrutement inclusif, formation des managers et des recruteurs, mission handicap avec temps dédié : missionhandicap@scalian.com)
Why take the plunge?

One of France's TOP10 engineering consultancies, the Group provides services in industrial project management, supply chain, architecture and development of embedded digital systems, information systems applications and Artificial Intelligence in sectors as varied as aeronautics, space, automotive, rail, services, luxury goods and retail.

Founded in 1989, SCALIAN today employs over 5,500 people in 12 countries and 15 locations in France, with sales of 550 million euros. SCALIAN works for major CAC40 groups on both TA and fixed-price projects.

Awarded the Great Place to Work label, SCALIAN is growing by 20% every year.

Why SCALIAN?

Because Scalian supports you in your career development: comprehensive 1-year onboarding program with your manager and HR, personalized training programs, technical communities, internal events, etc.

Because Scalian promotes Quality of Life at work: Great Place to Work® and Best Workplaces for Women certifications, co-optation bonus, vacation bonus, teleworking agreement.

Because Scalian is developing a concrete and ambitious CSR policy: Sustainable mobility, Environmental actions, Handicap Agreement and Mission Handicap with dedicated time (missionhandicap@scalian.com). Inclusive recruitment process, training for managers and recruiters.

Qualifications

Elève ingénieur ou universitaire en dernière année de cursus BAC+5 en data science :

  • Connaissances en utilisation des modèles LLMs
  • Connaissances techniques : Python : Hugging Face Transformers, LangChain, AutoGen, MCP
  • Vous êtes curieux, méthodique, rigoureux et autonome
Informations supplémentaires
Quelles seront les prochaines étapes ?
  • 1erentretien avec le N+1
  • 2ndentretien avec la N+2
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.