Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

STAGE : Data scientist H / F

IRSN

Nanterre

Hybride

EUR 100 000 - 125 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une organisation de recherche en France propose un stage spécialisé en data pour les étudiants en informatique. Les candidats travailleront sur l'analyse de rapports PDF, la mise en place d'une chaîne d'extraction semi-automatique, et le développement d'un pipeline ETL. Ce poste à Nanterre permet de travailler sur des projets innovants tout en contribuant à divers objectifs de recherche. Les candidats doivent avoir un diplôme en informatique avec une spécialisation en data ou IA.

Qualifications

  • Étudiant(e) en master en informatique ou ingénierie avec une spécialisation en data ou IA.
  • Compétences en développement de pipelines ETL.
  • Capacité à analyser et transformer des données à partir de rapports PDF.

Responsabilités

  • Analyser un échantillon représentatif de rapports PDF.
  • Mettre en place une chaîne d'extraction semi-automatique du texte.
  • Développer un pipeline ETL pour charger des données nettoyées dans le DWH.

Formation

Master 1 ou master 2 ou écoles d'ingénieurs en informatique avec option data / IA

Outils

Python
PDFMiner
Description du poste
Overview

Mission :

s :

Le stage sera séquencé selon les grandes étapes d'élaboration suivantes :

  • 1 - Analyse d'un échantillon représentatif de rapports PDF (qualité variable) ;
  • 2 - Mise en place une chaîne d'extraction semi-automatique du texte et des tableaux (PDFMiner ou équivalent) ;
  • 3 - Transformation des données selon le modèle de données cible SYRACUSE
  • 4 - Développement d'un pipeline ETL (Python ou équivalent) pour charger les données nettoyées dans le DWH.
  • 5 - Contrôles de la qualité de l'extraction (gestion des doublons...).

En plus des scripts et du pipeline prototype, le stagiaire produira un rapport d'évaluation dans lequel il présentera les performances, identifiera les limites et proposera des pistes d'industrialisation.

Qualifications

Profil recherché

Master 1 ou master 2 ou écoles d'ingénieurs en informatique avec option data / IA

Conditions

Téletravail

Engagement diversité

Occasionnel Diversité

La diversité est une des composantes de la politique RSE, RH et Qualité de Vie au Travail à lASNR.

Nous accordons la même considération à toutes les candidatures, sans discrimination, pour inclure tous les talents.

Quelles que soient les différences, nous souhaitons attirer, intégrer et fidéliser nos candidats et nos collaborateurs au sein dun environnement de travail inclusif.

L'ASNR conduit une politique active depuis de nombreuses années en faveur de l'égalité des chances au travail et l'emploi des personnes handicapées. Si vous êtes en situation de handicap, n'hésitez pas à nous faire part de vos éventuels besoins spécifiques afin que nous puissions les prendre en compte.

Localisation

Europe, France, Ile-de-France, Hauts-de-Seine

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.