Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Stage – IA générative appliquée aux données réseau : créer des données pour les futurs réseaux [...]

Orange SA

Belfort

Sur place

EUR 40 000 - 60 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise de télécommunications à Belfort cherche un stagiaire Data Science pour un projet de 6 mois. Vous analyserez des données réseau pour améliorer un modèle d'intelligence artificielle. Les candidats doivent avoir un Bac+5 en data science ou similaire, de solides compétences en Deep Learning et Python. Ce stage offre une expérience précieuse dans un domaine innovant, avec des missions clés concernant la qualité des données et la présentation des résultats techniques.

Qualifications

  • Compréhension des méthodes d’apprentissage automatique et manipulation des données en volume.
  • Capacité à structurer et évaluer des modèles génératifs.

Responsabilités

  • Analyser les données du fonctionnement d’un site réseau.
  • Préparer et organiser les données pour un modèle d’IA.
  • Tester et améliorer le modèle existant.
  • Analyser la qualité des données générées.
  • Livrables : code structuré, documentation, et présentation.

Connaissances

Deep Learning
Modèles génératifs
Python
Réseaux mobiles
Analyse
Curiosité scientifique
Rigueur
Présentation des résultats

Formation

Bac+5 en data science, informatique ou mathématiques appliquées

Outils

PyTorch
TensorFlow
NumPy
Pandas
Description du poste
about the role

1. Compréhension des données réseau

La mission implique d’analyser les données décrivant le fonctionnement d’un site réseau. Les KPIs (Key Performance Indicators) mesurent des éléments comme le nombre d’utilisateurs connectés, la qualité du signal ou le trafic transporté. Ils sont associés à des paramètres techniques propres aux sites radio (orientation d’antenne, réglages influençant la couverture). L’enjeu est de comprendre ce que ces données représentent et pourquoi elles varient.
Exemple :expliquer une hausse d’un indicateur en période d’affluence ou relier une variation à un changement technique.

2. Préparation et organisation des données

Les données doivent être rendues exploitables pour un modèle d’IA : vérification, nettoyage, structuration, mise en correspondance des éléments pertinents. Cette étape permet au modèle d’apprendre des relations fiables.
Exemple :associer l’évolution d’un KPI dans le temps avec les paramètres techniques du site correspondant pour mettre en évidence le lien entre configuration et comportement observé.

3. Test du modèle existant

Le modèle développé par l’équipe est exécuté sur les données préparées. Il repose sur des approches génératives, telles que les modèles de diffusion ou les GAN (Generative Adversarial Networks), qui apprennent à reproduire des comportements observés dans les données réelles. L’analyse consiste à vérifier la cohérence des résultats.
Exemple :confirmer que les données synthétiques reflètent la hausse de trafic observée à certaines heures.

4. Adaptation et amélioration du modèle

Le modèle est ensuite ajusté pour intégrer des données plus variées et représenter davantage de situations réseau, notamment celles qui n’ont pas encore été observées. Cette activité implique de modifier certaines parties du modèle et d’évaluer leur impact.
Exemple :générer ce qui pourrait se passer si un paramètre technique change dans une configuration nouvelle.

5. Analyse de la qualité des données générées

Une analyse permet d’évaluer si les données synthétiques sont crédibles : comparaison des courbes réelles et générées, cohérence des valeurs, étude des tendances et variations.
Exemple :vérifier qu’une hausse du trafic entraîne une évolution similaire dans les données réelles et synthétiques.

6. Livrables attendus

Un code structuré et réutilisable, organisé en étapes (préparation des données, entraînement, génération, évaluation).
Une documentation claire, décrivant la démarche, les tests effectués et les résultats obtenus.
Une présentation synthétique, destinée à des interlocuteurs issus de domaines différents (IA, données, réseaux), afin de faciliter la compréhension et l’utilisation des travaux.

about you

Une formation de niveau Bac+5 en data science, informatique, mathématiques appliquées ou domaine équivalent est adaptée au sujet. Cette base permet de comprendre les méthodes d’apprentissage automatique et de manipuler des données en volume.

Compétences techniques
  • • Bases solides en Deep Learning Le modèle repose sur des approches génératives, ce qui nécessite de connaître les principes fondamentaux du Deep Learning.
    Exemple :comprendre comment une architecture d’apprentissage apprend une tendance observée dans les données.
  • • Connaissance des modèles génératifs (atout) Les modèles de diffusion ou les GAN sont utilisés pour générer des données synthétiques proches des données réelles. Avoir déjà utilisé ce type de modèle facilite la prise en main du sujet et accélère la phase d’expérimentation.
    Exemple :savoir ajuster un paramètre ou interpréter la courbe de convergence d’un modèle.
  • • Très bonne maîtrise de Python Les bibliothèques couramment utilisées (PyTorch, TensorFlow, NumPy, Pandas, etc.) permettent d’entraîner les modèles, de structurer les données et d’analyser les résultats.
    Exemple :charger un fichier contenant des séries temporelles, appliquer une transformation, et visualiser l’évolution d’un indicateur.
  • • Notions sur les réseaux mobiles (atout) Comprendre les grands principes des réseaux 4G/5G aide à donner du sens aux KPIs et à interpréter certaines variations.
    Exemple :savoir qu’un site réseau couvre une zone et que certaines mesures reflètent l’activité des utilisateurs dans cette zone.
Qualités personnelles
  • • Capacité d’analyse Le sujet nécessite d’examiner attentivement des résultats, d’identifier les tendances pertinentes et de comprendre l’impact des paramètres techniques.
    Exemple :repérer qu’une anomalie provient d’un problème de données plutôt que d’un comportement réel du modèle.
  • • Curiosité scientifique Le projet se situe dans un domaine innovant où des solutions doivent être testées, comparées, puis améliorées.
    Exemple :essayer une variante du modèle pour comprendre si elle reproduit mieux un comportement réseau rare.
  • • Rigueur dans l’organisation du code et des données Les modèles doivent être reproductibles, les fichiers clairement organisés et la démarche documentée.
    Exemple :structurer un dossier de travail pour que les étapes « préparation → entraînement → évaluation » soient faciles à relancer.
  • • Capacité à présenter des résultats techniques de manière claire Les travaux sont partagés avec des interlocuteurs venant de l’IA, des données ou des réseaux mobiles. La capacité à expliquer simplement des résultats complexes est essentielle.
    Exemple :résumer l’évolution d’un KPI généré et expliquer en quoi il se rapproche du comportement réel.

Stage à temps plein de 6 mois

Lieu : Belfort (90)

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.