Activez les alertes d’offres d’emploi par e-mail !
Une société de télécommunications recherche un(e) stagiaire en data science pour automatiser la génération de données radios en Python et étudier des approches de géolocalisation indoor. Vous interagirez avec des chercheurs et vous utiliserez des modèles de réduction de dimension. Ce stage pourrait déboucher sur une publication scientifique.
Jusqu’à la fin des années 1990, les applications de géolocalisation étaient principalement utilisées comme aide à la navigation dans le domaine des transports (bateaux, avions, autos, ..), notamment en s’appuyant sur la technologie GPS de positionnement par satellites. Ce scénario a ensuite profondément évolué avec les réseaux de télécommunications (2G/3G/4G/5G, réseaux locaux sans fils Wi‑Fi, ..) et les objets connectés qui ont ouvert le champ à de très nombreuses applications. Au-delà des services, l’information de géolocalisation des équipements connectés au réseau devient aussi une information fondamentale pour optimiser la gestion des ressources radio des réseaux et la qualité de l’expérience utilisateur. Dans le cas particulier de l’indoor et de solutions de géolocalisation grand public, nous avons également des contraintes fortes sur les coûts (objets connectés bas cout), sur la consommation et sur le respect de la vie privée qui conduisent à utiliser le Wi‑Fi pour la géolocalisation. La géolocalisation indoor à partir du Wi‑Fi a été abondamment traitée dans la littérature notamment avec les approches de fingerprinting. Toutefois il s’agit d’approches supervisées pas forcément pertinentes pour le grand public. Dans ce stage nous proposons d’étudier des approches alternatives non supervisées.
En tant que stagiaire, votre mission consistera dans un premier temps à automatiser (en code Python) la génération de données radios simulées en bandes Wi‑Fi de type CSI (Channel State Information) à partir d’une liste d’images de plans d’habitats. Pour cela vous utiliserez un modèle radio open source (comme Sionna ou équivalent) et des outils déjà développés en interne concernant la vectorisation des images de plans. Dans un second temps, en collaboration avec une thèse, vous mettrez en œuvre des méthodes standards de réduction de dimension des données CSI vers de la 2D ou 3D, et les adapterez au problème de géolocalisation indoor non supervisée.
Ce stage s’inscrit dans le cadre de travaux de recherche et pourrait donner lieu à une publication scientifique. Vous serez encadré par nos experts en data science.
Ce sujet vous demandera de faire preuve de curiosité et d’esprit d’analyse afin de comprendre les variables importantes, et d’évaluer les algorithmes pertinents. Vous serez rapidement amené à interagir avec nos chercheurs, ingénieurs et data scientists, et vous devrez être capable de synthétiser les discussions. Vos compétences en développement et en traitement de données seront sollicitées pour le travail de modélisation.
Vous préparez un diplôme d’ingénieur ou Master 2, dans les domaines des mathématiques appliquées, de la Data Science, ou du développement. Vous avez de solides connaissances de Python, des librairies d’analyse de données, de traitement d’images et de Deep Learning (TensorFlow/PyTorch, OpenCV etc).