Activez les alertes d’offres d’emploi par e-mail !

STAGE - Ingénieur IA & Data : Réseaux Scientifiques (F/H)

Dassault Systèmes

Vélizy-Villacoublay

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 10 jours

Résumé du poste

Une entreprise innovante en Île-de-France recherche un étudiant pour contribuer au développement de solutions logicielles en Data Science. Le candidat idéal maîtrise Python et le traitement du langage naturel, et est intéressé par les graphes de connaissances et la désambiguïsation d'entités. Vous rejoindrez un environnement collaboratif engagé dans l'innovation technologique.

Prestations

Environnement collaboratif
Collaboration internationale
Engagement pour la diversité et l'inclusion

Qualifications

  • Actuellement en Master 2 / Bac+5 avec spécialisation en Data Science / Machine Learning.
  • Fait preuve de curiosité et de rigueur, aime la modélisation sémantique.
  • À l'aise en anglais, à l'écrit comme à l'oral.

Responsabilités

  • Contribuer au développement de briques logicielles pour améliorer la qualité des données scientifiques.
  • Analyser des textes scientifiques et extraire des infos pertinentes avec NLP.
  • Relier ces données à des graphes de connaissances.

Connaissances

Python
NLP (tokenisation, embeddings)
Modèles de langage (BERT, Qwen)

Formation

Master 2 / Bac+5 en Data Science / Machine Learning

Outils

Docker
APIs REST
Description du poste
Contexte

Chez Dassault Systèmes, nous unissons depuis des années nos forces avec des partenaires technologiques et scientifiques de renom (FDA, Harvard, MIT, INRIA, INSERM, Prix Nobel...) pour transformer les technologies de pointe en solutions concrètes pour nos clients. Nos objectifs sont clairs :

  • Proposer une offre complète de bout en bout,
  • Structurer les filières industrielles du futur,
  • Intégrer les technologies les plus avancées dans nos solutions.

Dans un monde où la science évolue vite, notre mission est d'explorer et cartographier les réseaux scientifiques (chercheurs(euses), organisations, thématiques), détecter les tendances émergentes et transformer ces connaissances en leviers d'innovation stratégique.

Pour cela, nous développons des outils exploitant les publications scientifiques, avec un défi majeur : désambiguïser et enrichir les entités (entreprises, chercheurs(euses)), afin d'améliorer la qualité et la fiabilité des données.

Vos missions

Vous contribuerez au développement de briques logicielles visant à améliorer la qualité des données scientifiques grâce à la désambiguïsation et à l'enrichissement d'entités nommées.

Concrètement, vous aurez pour mission de :

  • Analyser des textes scientifiques et extraire des informations pertinentes grâce à des techniques de traitement du langage naturel.
  • Relier ces données à des graphes de connaissances (Knowledge Graph) pour en accroître la valeur.
  • Améliorer la qualité et la précision des entités extraites grâce à des mécanismes de désambiguïsation.
Vos activités incluront
  • Proposer et expérimenter des algorithmes de désambiguïsation (symboliques, statistiques ou hybrides).
  • Concevoir un pipeline d'enrichissement sémantique interrogeant des sources externes.
  • Contribuer à l'intégration des résultats dans nos systèmes internes pour renforcer leur impact.
Expérience et environnement

En rejoignant Dassault Systèmes, vous participerez à des projets d'envergure internationale, à l'interface de la science, de l'IA et de l'innovation, dans un environnement stimulant qui valorise la curiosité, l'audace et la collaboration.

Vos qualifications

Vous êtes actuellement en Master 2 / Bac+5 (école d'ingénieur ou université) avec une spécialisation en Data Science / Machine Learning.

Vous faites preuve de curiosité et de rigueur, vous aimez la modélisation sémantique et les défis liés à la compréhension des réseaux de collaboration.

Vous maîtrisez :

  • Python (obligatoire)
  • Les bases du NLP (tokenisation, embeddings, etc.)
  • Une familiarité avec les modèles de langage (BERT, Qwen, etc.)

Vous souhaitez développer vos compétences sur :

  • Le web sémantique et la désambiguïsation d'entités
  • Les graphes de connaissances (RDF, SPARQL)
  • Le déploiement (Docker, APIs REST, etc.)

Vous êtes à l'aise en anglais, à l'écrit comme à l'oral.

Nous rejoindre c'est aussi

Intégrer une entreprise scientifique au cœur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans.

  • Un environnement collaboratif et innovant
  • Une collaboration internationale
  • Une diversité de technologies, produits et solutions
  • Un engagement fort en faveur de la diversité et de l'inclusion
Déclaration de diversité

Dassault Systèmes, avant-gardiste en matière de technologie et d'innovation durable, s'efforce de créer des équipes toujours plus inclusives et diverses à travers le monde. Nous avons la forte conviction que nos employés sont notre atout numéro 1 et nous voulons que tous, se sentent libres d\'être pleinement qui ils sont vraiment. Notre objectif est qu\'ils ressentent fierté et sentiment d\'appartenance. En tant qu\'entreprise à la pointe du changement, il nous incombe de favoriser l\'inclusion de tous et participer à création du monde de demain.

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.