
Activez les alertes d’offres d’emploi par e-mail !
Générez un CV personnalisé en quelques minutes
Décrochez un entretien et gagnez plus. En savoir plus
Une entreprise technologique majeure propose un stage de 6 mois à Belfort, où vous développerez des modèles d'intelligence artificielle pour générer des données réseau synthétiques. Vous travaillerez sur des données complexes, aiderez à adapter et tester des modèles, et apprendrez à structurer des résultats techniques pour divers interlocuteurs. Une formation Bac+5 en data science ou mathématiques est requise, ainsi qu'une solide maîtrise de Python et des bases en Deep Learning.
Compréhension des données réseau
La mission implique d'analyser les données décrivant le fonctionnement d'un site réseau. Les KPIs (Key Performance Indicators) mesurent des éléments comme le nombre d'utilisateurs connectés, la qualité du signal ou le trafic transporté. Ils sont associés à des paramètres techniques propres aux sites radio (orientation d'antenne, réglages influençant la couverture). L'enjeu est de comprendre ce que ces données représentent et pourquoi elles varient.
Exemple : expliquer une hausse d'un indicateur en période d'affluence ou relier une variation à un changement technique.
Préparation et organisation des données
Les données doivent être rendues exploitables pour un modèle d'IA : vérification, nettoyage, structuration, mise en correspondance des éléments pertinents. Cette étape permet au modèle d'apprendre des relations fiables.
Exemple : associer l'évolution d'un KPI dans le temps avec les paramètres techniques du site correspondant pour mettre en évidence le lien entre configuration et comportement observé.
Test du modèle existant
Le modèle développé par l'équipe est exécuté sur les données préparées. Il repose sur des approches génératives, telles que les modèles de diffusion ou les GAN (Generative Adversarial Networks), qui apprennent à reproduire des comportements observés dans les données réelles. L'analyse consiste à vérifier la cohérence des résultats.
Exemple : confirmer que les données synthétiques reflètent la hausse de trafic observée à certaines heures.
Adaptation et amélioration du modèle
Le modèle est ensuite ajusté pour intégrer des données plus variées et représenter davantage de situations réseau, notamment celles qui n'ont pas encore été observées. Cette activité implique de modifier certaines parties du modèle et d'évaluer leur impact.
Exemple : générer ce qui pourrait se passer si un paramètre technique change dans une configuration nouvelle.
Analyse de la qualité des données générées
Une analyse permet d'évaluer si les données synthétiques sont crédibles : comparaison des courbes réelles et générées, cohérence des valeurs, étude des tendances et variations.
Exemple : vérifier qu'une hausse du trafic entraîne une évolution similaire dans les données réelles et synthétiques.
Livrables attendus
Un code structuré et réutilisable, organisé en étapes (préparation des données, entraînement, génération, évaluation).
Une documentation claire, décrivant la démarche, les tests effectués et les résultats obtenus.
Une présentation synthétique, destinée à des interlocuteurs issus de domaines différents (IA, données, réseaux), afin de faciliter la compréhension et l'utilisation des travaux.
Une formation de niveau Bac+5 en data science, informatique, mathématiques appliquées ou domaine équivalent est adaptée au sujet. Cette base permet de comprendre les méthodes d'apprentissage automatique et de manipuler des données en volume.
Bases solides en Deep Learning
Le modèle repose sur des approches génératives, ce qui nécessite de connaître les principes fondamentaux du Deep Learning.
Exemple : comprendre comment une architecture d'apprentissage apprend une tendance observée dans les données.
Connaissance des modèles génératifs (atout)
Les modèles de diffusion ou les GAN sont utilisés pour générer des données synthétiques proches des données réelles. Avoir déjà utilisé ce type de modèle facilite la prise en main du sujet et accélère la phase d'expérimentation.
Exemple : savoir ajuster un paramètre ou interpréter la courbe de convergence d'un modèle.
Très bonne maîtrise de Python
Les bibliothèques couramment utilisées (PyTorch, TensorFlow, NumPy, Pandas, etc.) permettent d'entraîner les modèles, de structurer les données et d'analyser les résultats.
Exemple : charger un fichier contenant des séries temporelles, appliquer une transformation, et visualiser l'évolution d'un indicateur.
Notions sur les réseaux mobiles (atout)
Comprendre les grands principes des réseaux 4G/5G aide à donner du sens aux KPIs et à interpréter certaines variations.
Exemple : savoir qu'un site réseau couvre une zone et que certaines mesures reflètent l'activité des utilisateurs dans cette zone.
Capacité d'analyse
Le sujet nécessite d'examiner attentivement des résultats, d'identifier les tendances pertinentes et de comprendre l'impact des paramètres techniques.
Exemple : repérer qu'une anomalie provient d'un problème de données plutôt que d'un comportement réel du modèle.
Curiosité scientifique
Le projet se situe dans un domaine innovant où des solutions doivent être testées, comparées, puis améliorées.
Exemple : essayer une variante du modèle pour comprendre si elle reproduit mieux un comportement réseau rare.
Rigueur dans l'organisation du code et des données
Les modèles doivent être reproductibles, les fichiers clairement organisés et la démarche documentée.
Exemple : structurer un dossier de travail pour que les étapes "préparation → entraînement → évaluation" soient faciles à relancer.
Capacité à présenter des résultats techniques de manière claire
Les travaux sont partagés avec des interlocuteurs venant de l'IA, des données ou des réseaux mobiles. La capacité à expliquer simplement des résultats complexes est essentielle.
Exemple : résumer l'évolution d'un KPI généré et expliquer en quoi il se rapproche du comportement réel.
Stage à temps plein de 6 mois
Lieu : Belfort (90)
Ce stage permet d'apprendre à travailler sur des données qui viennent du terrain, avec tout ce qu'elles ont de riche, d'imparfait et d'instructif. Comprendre ce qu'elles mesurent, repérer ce qui compte, structurer l'information pour qu'un modèle puisse l'apprendre : c'est une compétence rare et déterminante pour la suite d'un parcours en data ou en IA.
La mission permet aussi de découvrir ce qu'implique réellement l'adaptation d'un modèle d'intelligence artificielle : examiner son fonctionnement, comprendre pourquoi il réagit d'une certaine manière, tester des pistes d'amélioration et mesurer leur impact. C'est une manière concrète d'apprendre comment un modèle devient un outil fiable, et pas seulement un exercice académique.
L'analyse des données synthétiques produites apporte un autre type d'apprentissage : savoir juger de la crédibilité d'un résultat, expliquer une variation, détecter une incohérence. Ces réflexes sont précieux dans des projets où l'on attend de l'IA qu'elle éclaire une décision.
Enfin, présenter régulièrement les résultats à des interlocuteurs issus de domaines différents développe une compétence essentielle : expliquer clairement une démarche technique et structurer un raisonnement pour le rendre accessible. Cette capacité est utile aussi bien pour poursuivre vers la recherche – ce sujet s'y prête naturellement par sa dimension de modélisation – que pour entrer dans le monde professionnel, où l'IA doit être comprise et maîtrisée pour guider des choix.
Ce stage se déroule au sein d'Orange, dans une équipe spécialisée dans les projets Data et IA appliqués aux réseaux mobiles. L'équipe contribue au développement des jumeaux numériques (" Digital Twins ") , des modèles qui permettent de simuler le comportement d'un réseau dans différentes situations, y compris celles qui n'existent pas encore (par exemple des configurations futures de réseaux 5G/6G).
Pour que ces simulations soient réalistes, il faut disposer d'exemples variés de données réseau. Comme certaines situations futures ne peuvent pas être observées aujourd'hui, l'équipe développe des modèles capables de générer des données " synthétiques " mais proches des données réelles, afin d'enrichir les scénarios utilisés pour étudier les performances des réseaux de demain.
Le stage consiste à développer un modèle d'intelligence artificielle capable de produire ces données synthétiques à partir de données existantes. Ce travail contribuera directement aux outils utilisés pour analyser et anticiper le fonctionnement des futurs réseaux mobiles d'Orange.
Stage
Date souhaitée de prise de poste : 06 avr. 2026
Niveau d'études préparé pendant le stage Indemnité brute selon école Bac+5 de 1621 € à 2162 € / mois