Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Instruction et développement de solution de text-mining pour l'ingénierie nucléaire F/H

EDF

Chatou

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 15 jours

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise de production d'énergie recherche un stagiaire pour travailler sur des solutions de text-mining visant à améliorer la recherche d'information. Le stagiaire intégrera l'équipe R&D à EDF Lab Chatou et se concentrera sur le développement de méthodes adaptées aux documents techniques dans le domaine de la production d’énergie. Ce stage offre l’opportunité de collaborer avec des ingénieurs chercheurs et de développer des compétences en IA et traitement de données.

Responsabilités

  • Tester et évaluer des méthodes de text-mining sur un cas d’usage spécifique.
  • Développer un code exploitant l’ontologie pour l’amélioration de la recherche textuelle.
  • Analyser les résultats de la méthode appliquée.

Connaissances

Connaissances en TAL et IA
Modélisation des connaissances
Python
GitLab
Linux
Bon niveau en français ou anglais

Formation

M2
Description du poste
Intitulé du stage complet : Instruction et développement de solution de text-mining pour l’ingénierie nucléaire, intégration d’ontologie pour l’amélioration de la recherche

Le groupe EDF est une entreprise innovante et leader en France de la production et la fourniture d’énergie. Le groupe compte parmi les premiers producteurs d’électricité bas carbone au monde. Acteur clé de la lutte contre le réchauffement climatique, EDF participe activement à la décarbonation des usages.

Contexte

La R&D d’EDF a développé depuis plusieurs années des activités de text-mining pour les besoins des métiers de la production d’énergie. La R&D accompagne les métiers dans l’expression de leurs besoins et apporte des solutions adaptées pour y répondre. Elle apporte du support aux métiers de l’ingénierie (pour l’énergie nucléaire et / ou hydraulique) par l’exploitation des différentes bases documentaires afin d’en faciliter leur exploitation pour leurs études. Les besoins dans le domaine du producteur nécessitent des développements adaptés spécifiquement à leur cas d’usage prenant en compte un vocabulaire technique et une connaissance métier.

Les activités peuvent aller de l’extraction d’information, l’amélioration de la recherche d’information des bases documentaires, la catégorisation automatique des documents, le développement d’outil spécifique, à des tests d’outils spécialisés dans le text-mining développés par des entreprises externes.

Travail attendu

La mission principale du stage est d’appuyer l’équipe d’ingénieurs chercheurs travaillant dans le domaine du text-mining / NLP basée à EDF Lab Chatou.

Les travaux consistent plus précisément à tester et évaluer des méthodes de text-mining sur un cas d’usage spécifique dans le domaine de la production d’énergie. Les documents techniques du producteur ont différents types de spécificités à prendre en compte : un vocabulaire technique, une variété de documents à traiter (rapport d'analyse, note d'étude, REX, constat de maintenance, documentation technique, exigences fonctionnelles etc.), des procédures de traitement différents selon les métiers, etc. Ces caractéristiques sont déterminantes pour les applications des différentes méthodes de text-mining / NLP.

Le but du stage sera d’étudier les moyens d’intégration d’une ontologie pour l’amélioration de la recherche textuelle pour une plateforme de mise à disposition et de visualisation des données, conçue par la R&D.

En fonction de ses compétences et de l’avancée des études R&D, le stagiaire interviendra sur les thématiques détaillées ci-dessous :

  1. Prise en main de la plateforme de mise à disposition des données des producteurs
  2. Développement d’un code exploitant l’ontologie pour l’amélioration de la recherche textuelle
  3. Étude et analyse des résultats de la méthode
  4. Restitution

Niveau d’études : M2

Compétences techniques :
  • TAL : connaissances d’au moins une des méthodes : d’IA symbolique, machine-learning, deep-learning.
  • Modélisation des connaissances : des bases en développement et / ou exploitation d’ontologie
  • Langage de programmation : Python
  • GitLab
  • Linux

Langue : français ou anglais de bon niveau (écrit et parlé)

Savoir-être :
  • Autonomie, capacité d’initiative
  • Rigueur
  • Persévérance, motivation
  • Esprit critique
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.