
Activez les alertes d’offres d’emploi par e-mail !
Générez un CV personnalisé en quelques minutes
Décrochez un entretien et gagnez plus. En savoir plus
Une entreprise de télécommunications à Belfort cherche un stagiaire Data Science pour un projet de 6 mois. Vous analyserez des données réseau pour améliorer un modèle d'intelligence artificielle. Les candidats doivent avoir un Bac+5 en data science ou similaire, de solides compétences en Deep Learning et Python. Ce stage offre une expérience précieuse dans un domaine innovant, avec des missions clés concernant la qualité des données et la présentation des résultats techniques.
1. Compréhension des données réseau
La mission implique d’analyser les données décrivant le fonctionnement d’un site réseau. Les KPIs (Key Performance Indicators) mesurent des éléments comme le nombre d’utilisateurs connectés, la qualité du signal ou le trafic transporté. Ils sont associés à des paramètres techniques propres aux sites radio (orientation d’antenne, réglages influençant la couverture). L’enjeu est de comprendre ce que ces données représentent et pourquoi elles varient.
Exemple :expliquer une hausse d’un indicateur en période d’affluence ou relier une variation à un changement technique.
2. Préparation et organisation des données
Les données doivent être rendues exploitables pour un modèle d’IA : vérification, nettoyage, structuration, mise en correspondance des éléments pertinents. Cette étape permet au modèle d’apprendre des relations fiables.
Exemple :associer l’évolution d’un KPI dans le temps avec les paramètres techniques du site correspondant pour mettre en évidence le lien entre configuration et comportement observé.
3. Test du modèle existant
Le modèle développé par l’équipe est exécuté sur les données préparées. Il repose sur des approches génératives, telles que les modèles de diffusion ou les GAN (Generative Adversarial Networks), qui apprennent à reproduire des comportements observés dans les données réelles. L’analyse consiste à vérifier la cohérence des résultats.
Exemple :confirmer que les données synthétiques reflètent la hausse de trafic observée à certaines heures.
4. Adaptation et amélioration du modèle
Le modèle est ensuite ajusté pour intégrer des données plus variées et représenter davantage de situations réseau, notamment celles qui n’ont pas encore été observées. Cette activité implique de modifier certaines parties du modèle et d’évaluer leur impact.
Exemple :générer ce qui pourrait se passer si un paramètre technique change dans une configuration nouvelle.
5. Analyse de la qualité des données générées
Une analyse permet d’évaluer si les données synthétiques sont crédibles : comparaison des courbes réelles et générées, cohérence des valeurs, étude des tendances et variations.
Exemple :vérifier qu’une hausse du trafic entraîne une évolution similaire dans les données réelles et synthétiques.
6. Livrables attendus
Un code structuré et réutilisable, organisé en étapes (préparation des données, entraînement, génération, évaluation).
Une documentation claire, décrivant la démarche, les tests effectués et les résultats obtenus.
Une présentation synthétique, destinée à des interlocuteurs issus de domaines différents (IA, données, réseaux), afin de faciliter la compréhension et l’utilisation des travaux.
Une formation de niveau Bac+5 en data science, informatique, mathématiques appliquées ou domaine équivalent est adaptée au sujet. Cette base permet de comprendre les méthodes d’apprentissage automatique et de manipuler des données en volume.
Stage à temps plein de 6 mois
Lieu : Belfort (90)