Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Évaluation de l’utilisation des LLMs pour l’extraction de données scientifiques à partir de doc[...]

TOTAL Deutschland GmbH

France

Sur place

EUR 40 000 - 60 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise de recherche en énergies renouvelables recherche un stagiaire en data science pour une durée de 6 mois. Le candidat évaluera des solutions de modèles de langage (LLMs) en interagissant avec eux et en mettant en place des méthodes pour extraire des données scientifiques. Des compétences en intelligence artificielle, apprentissage automatique, et traitement automatique des langues sont nécessaires, tout en maîtrisant des outils comme Python et ses bibliothèques associées. La formation nécessitée est un Bac+5 en école d'ingénieur ou Master, avec un niveau d'anglais B2.

Qualifications

  • Compétences en informatique et data science.
  • Niveau d'anglais B2 requis.
  • Maîtrise des langages et outils courants.

Responsabilités

  • Évaluer différentes solutions LLM en mode interactif et via API.
  • Définir et tester des modes opératoires pour l’extraction de données scientifiques.
  • Familiariser l’équipe avec l’écosystème LLM interne.
  • Proposer des recommandations pour l’intégration des LLMs dans les workflows existants.

Connaissances

Intelligence artificielle
Apprentissage automatique
Traitement automatique des langues (NLP)
Python
pandas
NumPy
PyTorch
TensorFlow

Formation

Bac+5 : École d'ingénieur / Master

Outils

APIs
LLM Hub
Copilot
Description du poste

Au sein de la brancheOneTech de TotalEnergies, vous rejoindrez le Centre de Recherche de Solaize, situé à 15 minutes au sud de Lyon.

Le site regroupe plus de 300 chercheurs dans un environnement verdoyant 🌳.

Il constitue l’un des principaux centres de R&D de TotalEnergies, dédié notamment :

  • Au développement de solutions ainsi que de moyens de mesure et de contrôle des émissions de gaz à effet de serre
  • À la formulation de produits à faible empreinte environnementale et décarbonés pour les mobilités thermique, électrique et pour l’industrie (carburants non fossiles d’origine renouvelable, lubrifiants, fluides caloporteurs, bitumes, etc.)

Les activités implantées sur le site évoluent constamment pour répondre aux objectifs et aux ambitions de la compagnie TotalEnergies en matière de neutralité carbone et d’accessibilité à des énergies abordables et propres pour le plus grand nombre.

TotalEnergies s’inscrit dans une ambition climat forte, visant la neutralité carbone à horizon 2050. Cette transformation s’accompagne d’une digitalisation accrue de la R&D, avec la mise en place d’approches prédictives pour accélérer le développement de nouvelles molécules et matériaux répondant aux besoins des mobilités durables. Dans ce cadre, l’exploitation efficace des données scientifiques issues de sources variées (articles, documents techniques, fichiers semi-structurés) est un levier essentiel pour innover plus rapidement et de manière responsable.

Les modèles de langage (LLMs) offrent des perspectives inédites pour automatiser cette extraction et faciliter l’accès à l’information.

Objectifs du stage :

  • Évaluer différentes solutions LLM (Copilot, ChatGPT, MistralAI) en mode interactif (chat) et via API.
  • Définir et tester des modes opératoires pour l’extraction de données scientifiques à partir, d’articles scientifiques,de documents techniques, de fichiers Excel semi-standardisés.
  • Familiariser l’équipe avec l’écosystème LLM interne (LLM Hub TotalEnergies, outils associés).
  • Proposer des recommandations pour l’intégration des LLMs dans les workflows existants.

🛠️ Moyens et outils utilisés :

  • Accès aux solutions LLM internes et externes (LLM Hub, Copilot, etc.).
  • Collaboration avec l’équipe R&D spécialisée en science des données

Formation Bac+5 : Ecole ingénieur / Master

🌐 Niveau d'anglais : B2

🗓️Période de stage : 6 mois

Des compétences en informatique et data science sont recherchées, notamment en intelligence artificielle et apprentissage automatique, traitement automatique des langues (NLP), ainsi qu’une maîtrise des langages et outils courants (Python – pandas, NumPy, PyTorch/TensorFlow – APIs et intégration de modèles LLM).

Créée par TotalEnergies pour accompagner sa transformation vers les énergies renouvelables, OneTech regroupe les expertises techniques et R&D des branches (Exploration & Production, Raffinage Chimie, Marketing & Services et Gas, Renewables & Power).

Avec 3 400 ingénieurs et techniciens répartis sur plusieurs sites en Europe, elle s’organise autour de trois pôles : Industriel - Recherche & Développement - Fonctions supports

OneTech est un pilier de la stratégie multi-énergies de TotalEnergies.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.