Activez les alertes d’offres d’emploi par e-mail !

Stagiaire Data Scientist - Products Data (H/F)

BearingPoint GmbH

Courbevoie

Hybride

EUR 30 000 - 50 000

Plein temps

Il y a 30+ jours

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Une entreprise de conseil dynamique recherche deux Stagiaires Data Scientist pour rejoindre son équipe innovante. Vous travaillerez sur des projets passionnants utilisant l'IA et le Machine Learning pour améliorer les processus dans l'industrie de la presse et le crédit management. Ce stage vous permettra de développer des solutions d'IA, d'intégrer des modèles dans un environnement de production, et de collaborer avec des experts en data engineering. Si vous êtes passionné par la technologie et souhaitez contribuer à des projets d'envergure, cette opportunité est faite pour vous.

Prestations

Carte Swile
Gymlib
Subvention télétravail
Espaces de coworking
Mobilité durable
Parentalité
Formations sur mesure
Certifications
Moments fédérateurs et festifs

Qualifications

  • Master 2 ou école d’ingénieur en Data Science, IA ou Machine Learning.
  • Expérience en Data Science, surtout avec LLMs et IA Générative.

Responsabilités

  • Réaliser un état de l’art des modèles LLMs et IA Générative.
  • Concevoir des solutions d’IA pour analyser et enrichir des manuscrits.

Connaissances

Machine Learning
Data Science
Collaboration en équipe
Communication en français et anglais
Curiosité

Formation

Master 2 en Data Science
École d’ingénieur avec spécialisation en IA

Outils

Python
SQL
Pandas
Scikit-learn
PyTorch
Hugging Face
Docker
AWS
Streamlit
LangChain

Description du poste

BearingPoint est un cabinet de Conseil référent qui a investi depuis une décennie dans l’IA et le Machine Learning.

L’équipe Products, notre Data Factory, réunit aujourd’hui un spectre large de compétences et d’expertises (data engineer, data scientist, devops, dev full stack, architecte, RPA) mobilisées au quotidien dans le Build et le Run d’applications commercialisées en mode SaaS. Elles couvrent des domaines variés (pricing, prévision des ventes, risque crédit, prévisions RH) que nous allons enrichir ensemble.

Nous recherchons deux Stagiaires Data Scientist pour renforcer notre équipe technique.

Vous travaillerez sur l’un des deux sujets :

1. DemandSens : LLMs & IA Générative pour l'Analyse de Manuscrits

DemandSens est une solution logicielle SaaS (AWS) dédiée à l’industrie de la presse quotidienne, magazine et de l'édition. Grâce à l'IA, DemandSens permet de repenser et d’améliorer les processus de distribution, la prévision des ventes ainsi que les décisions de tirage.

Le nouveau projet se concentre sur l’application des technologies LLMs et d’IA Générative pour analyser et enrichir les manuscrits de livres, avec des objectifs tels que la génération de résumés, l’identification des thèmes et des personnages, ainsi que l’élaboration de fiches descriptives. Le projet explore également la mise en place d'un système RAG (Retrieval-Augmented Generation) et la faisabilité d’utiliser les informations extraites pour prédire le potentiel de vente d’un livre.

Dans le cadre de ce stage, vous serez amené(e) à :

  • Réaliser un état de l’art des modèles LLMs et IA Générative existants.
  • Concevoir et développer des solutions d’IA permettant de générer un résumé complet à partir d’un manuscrit, d’identifier les principaux thèmes, mots-clés du texte, de décrire les personnages principaux à l’aide de fiches descriptives, de mettre en place un système RAG (Retrieval-Augmented Generation) pour permettre la recherche d’informations pertinentes à partir du manuscrit, d’extraire et générer des informations utiles aux objectifs marketing.
  • Développer une interface utilisateur (UI) pour présenter ces fonctionnalités.
  • Collaborer avec les data engineers pour intégrer et déployer les modèles dans un environnement de production.
  • Assurer une veille technologique et algorithmiques continue sur les avancées en LLMs et IA Générative.
2. Sellia : LLMs & IA Générative pour le Crédit Management

Sellia est conçue pour optimiser les processus de vente, évaluer le risque de solvabilité en temps réel et fournir une visibilité à 360° sur les clients. Elle aide les entreprises à prendre des décisions éclairées concernant leurs prospects et clients grâce à ses capacités avancées de prédiction et d'analyse des risques financiers.

Le nouveau projet implique l’utilisation des LLMs (Large Language Models) et de l'IA Générative pour assister les credit managers dans la gestion de leur portefeuille.

Dans le cadre de ce stage, vous serez amené(e) à :

  • Réaliser un état de l’art des modèles LLMs et IA Générative existants.
  • Concevoir et développer des solutions d’IA permettant de générer un rapport complet sur l’état financier d'une entreprise et évaluer le risque de la prendre comme client, à partir des sources externes et des données propriétaires de Sellia.
  • Collaborer avec les data engineers pour intégrer et déployer les modèles dans un environnement de production.
  • Assurer une veille technologique et algorithmiques continue sur les avancées en LLMs et IA Générative.

Votre profil :

  • Vous êtes en Master 2 ou en troisième année d'une école d’ingénieur avec une spécialisation en Data Science, IA ou Machine Learning.
  • Vous possédez une première expérience en Data Science, notamment dans l’utilisation de modèles LLMs et d’algorithmes d’IA Générative.
  • Vous maîtrisez les concepts et techniques du machine learning, ainsi que les outils et langages associés, en particulier Python.
  • Vous êtes curieux(se) et avez un intérêt pour les modèles open-source et les technologies IA de pointe.
  • Vous savez collaborer en équipe, mener des projets de bout en bout, et communiquer efficacement en français et en anglais.

Vous êtes à l’aise avec les technologies suivantes ou souhaitez-vous former davantage :

  • Systèmes : Windows, Linux (Ubuntu, WSL2).
  • Langages : Python, SQL
  • Data Science/ML: Pandas, Scikit-learn, PyTorch, Hugging Face, transformers, modèles de langage, modèles d'IA Générative
  • Logiciels : LangChain, Streamlit
  • Bases de données : postgreSQL, bases de données vectorielles
  • Cloud : Azure, AWS
  • Conteneurs : Docker/Podman
  • Divers : Github, VSCode, Azure Devops
  • Langues : Français et Anglais

Vous souhaitez construire une carrière dynamique et évolutive ?

Nous vous accompagnons au quotidien dans le développement de vos compétences grâce à des formations sur mesure et des certifications. Vos appétences et souhaits d’évolution sont également considérés pour vous permettre de réussir professionnellement et vous épanouir personnellement.

BearingPoint vous offre :

  • Un métier, des missions, et un environnement de travail attractifs.
  • Un mode de travail hybride, flexible et collaboratif.
  • Un parcours de carrière dynamique et personnalisé.
  • Des moments fédérateurs et festifs.
  • La possibilité de soutenir des projets sociaux, sociétaux et environnementaux.
  • Et d'autres avantages attractifs : carte Swile, Gymlib, subvention télétravail, espaces de coworking, mobilité durable, parentalité...

La société BearingPoint s’engage à respecter la loi n° 2004-1486 du 30 décembre 2004 contre les discriminations et pour l’égalité des chances. Les informations demandées au candidat concernent uniquement sa capacité à occuper l'emploi proposé et ses aptitudes professionnelles.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.