Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

STAGE - Ingénieur en intelligence artificielle appliquée à la littérature scientifique en scien[...]

Dassault Systèmes

Vélizy-Villacoublay

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 2 jours
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise technologique en innovation recherche un stagiaire pour travailler sur des projets de Data Science, visant l'amélioration continue des processus. Le candidat idéal est étudiant en BAC+5, maîtrisant Python et les techniques de machine learning. Ce stage offre une expérience précieuse dans l'analyse de données au sein d'une équipe dynamique entre la France et le Royaume-Uni. Un accès à un environnement multiculturel et à des avantages sociaux est également proposé.

Prestations

Environnement multiculturel
Cadre de travail convivial
Politique dynamique de développement de carrière

Qualifications

  • Étudiant(e) en Ecole d'Ingénieurs ou Master, spécialisation Data Science.
  • Maîtrise de Python et des bibliothèques de data science.
  • Intérêt pour la recherche en science des matériaux.

Responsabilités

  • Travailler sur un projet d'amélioration continue avec Vélizy et Cambridge.
  • Analyser des données liées à des tests de service continus.
  • Présenter des idées innovantes et formuler des recommandations.

Connaissances

Python
Pandas
Scikit-learn
TensorFlow
PyTorch
Machine learning
Traitement du langage naturel
Analyse de données

Formation

Diplôme de niveau BAC+5 en Data Science ou Intelligence Artificielle
Description du poste
STAGE - Ingénieur en intelligence artificielle appliquée à la littérature scientifique en science des matériaux (F/H)

Les solutions cloud de BIOVIA permettent la création, le traitement, l’interprétation, le stockage et la gestion des données scientifiques afin de soutenir la recherche, le développement et la fabrication dans les domaines des matériaux et des produits pharmaceutiques. Nos solutions en science des matériaux et ingénierie, biosciences, et informatique scientifique et de laboratoire sont largement utilisées dans les laboratoires et centres de recherche à travers le monde.

Nos équipes R&D étendent les solutions sur site vers le cloud, faisant de cette opportunité une excellente occasion d’aider à transformer la livraison des logiciels et à soutenir la recherche et les laboratoires du futur.

Les objectifs de l’équipe sont axés sur la qualité logicielle et les exigences réglementaires de l’industrie (par exemple, la conformité GxP), qui reposent de plus en plus sur l’automatisation des tests et les fonctionnalités d’IA. Cela nécessite et génère un volume croissant de données, dont nous souhaitons analyser les retours d’expérience pour une amélioration continue.

Pour renforcer nos efforts continus d’amélioration de nos opérations et rester à la pointe de l’innovation en science des données, nous recherchons un stagiaire passionné en Data Science.

Vos missions :
Votre mission sera de travailler sur un projet centré sur notre processus interne et de nous accompagner dans notre démarche d’amélioration continue en collaboration entre les sites de Vélizy et de Cambridge (Royaume-Uni). Vous aurez l’opportunité de générer et analyser des données liées à nos tests de service continus et de soutenir notre département Qualité en utilisant des techniques et outils avancés de Data Science.

Vous jouerez un rôle clé au sein de l’organisation en présentant des idées innovantes, en identifiant les tendances émergentes et en formulant des recommandations concrètes liées aux opérations de nos équipes.

Ce stage vous permettra d’acquérir une expérience pratique en manipulation de données, analyse statistique et modélisation prédictive, renforçant ainsi vos compétences et connaissances dans le domaine de la science des données.

Description :
Développer des concepts et prototypes utilisant les modèles de langage de grande taille (LLM) pour informer et accélérer les projets en science des matériaux en accédant aux dernières informations issues de sources publiques et de la littérature ouverte, et générer des jeux de données gérés par les applications BIOVIA (par exemple Scientific Notebook, Materials Management, Scientific Insight, etc.).

Détails :
Ce stage explorera l’utilisation des LLM pour automatiser l’extraction, la validation et l’analyse statistique des informations issues de la littérature scientifique open-source en science des matériaux. Le projet s’appuiera sur un serveur MCP Python pour orchestrer une chaîne automatisée incluant la recherche web, le scraping de données, la récupération sémantique et la synthèse spécifique au domaine :

L’objectif est de transformer les données textuelles non structurées — principalement issues d’articles en accès libre — en connaissances structurées et exploitables. Cela comprend l’identification des paramètres expérimentaux, des résultats et des tendances dans divers domaines des matériaux.

Technologies et capacités clés :

  • Serveur MCP Python : Hub central pour la gestion des appels API, l’ingestion des données et les workflows d’analyse.
  • Recherche Web Automatisée & Validation : Enrichissement en temps réel et recoupement des données extraites via une vérification factuelle basée sur LLM.
  • Pipeline scientifique RAG : Retrieval-Augmented Generation adapté à la littérature scientifique, permettant Q&A contextuel et synthèse.
  • Intégration base de données : Stockage structuré des insights extraits pour requêtes et analyses en aval.
  • Moteur d’analyse statistique : Génération automatisée de statistiques descriptives, corrélations et visualisations de tendances.

Vos qualifications :

  • Etudiant.e préparant un diplôme de niveau BAC+5, Ecole d'Ingénieurs ou Master Universitaire, avec une spécialisation en Data Science / Intelligence Artificielle.
  • Maîtrise de Python et des bibliothèques de data science (Pandas, Numpy, Scikit-learn, TensorFlow, PyTorch).
  • Connaissances approfondies des techniques de machine learning et de traitement du langage naturel (NLP).
  • Expérience en analyse de données, clustering, détection d’anomalies et classification.
  • Intérêt pour la recherche et développement dans les domaines de la science des matériaux et des sciences de la vie.
  • Bonnes compétences en communication pour présenter les résultats d’analyse.
  • Capacité à travailler de manière autonome et à résoudre des problèmes complexes.
  • Veille technologique sur les dernières tendances en data science et big data.
  • Aptitude à travailler dans un environnement international.

Nous rejoindre c'est aussi
Intégrer une entreprise scientifique au cœur de l’innovation technologique, portée par une forte croissance depuis plus de 40 ans

Principaux avantages et bénéfices :

  • Environnement multiculturel
  • Cadre de travail convivial axé sur le bien-être et la santé (salles de sport & de musique, conciergerie)
  • Engagement en faveur de la diversité et de l’inclusion
  • Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc.
Déclaration de diversité

Dassault Systèmes, avant-gardiste en matière de technologie et d’innovation durable, s’efforce de créer des équipes toujours plus inclusives et diverses à travers le monde. Nous avons la forte conviction que nos employés sont notre atout numéro 1 et nous voulons que tous, se sentent libres d’être pleinement qui ils sont vraiment. Notre objectif est qu’ils ressentent fierté et sentiment d’appartenance. En tant qu’entreprise à la pointe du changement, il nous incombe de favoriser l’inclusion de tous et participer à création du monde de demain.

BIOVIA® propose un environnement de collaboration scientifique destiné aux expériences avancées en matière de biologie, de chimie et de matériaux.

Vous voulez en savoir plus?

Pour en savoir plus, consultez toutes les rubriques de notre site web.

En savoir plus sur votre parcours de recrutement.

Rejoignez-nous et consultez nos offres de stage et d'emploi.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.