about the role
L'objectif principal de ce stage est d'explorer et d'évaluer les modèles de fondation pour le forecasting de séries temporelles. Plus précisément, il s'agit de :
- Réaliser un état de l'art des méthodes et modèles récents en IA générative appliquée à la prévision de séries temporelles.
- Tester et comparer les principaux modèles de fondations (tels que Amazon Chronos, Salesforce Moirai, Google TimesFM, Nixtla TimeGPT etc.) sur des jeux de données publiques connus mais surtout sur des données propriétaires d'Orange pour évaluer leur performance en contexte réel.
- Mesurer et analyser la précision des prévisions, ainsi que le temps de calcul nécessaire à leur entraînement et à leur inférence.
- Formuler des recommandations sur les modèles les plus adaptés en fonction des critères de performance et de complexité.
Le stage se déroulera dans un environnement Python, utilisant principalement :
- Bibliothèques de traitement de données : pandas, numpy.
- Frameworks de modélisation (si nécessaire) : PyTorch, TensorFlow, Hugging Face Transformers.
- MLOps: poetry, pyenv, uv, MLflow.
- Outils d’évaluation : scikit-learn, statsmodels, nixtla.
- Plateformes de calcul : Environnement local avec GPU ou CPU.
- Accès aux jeux de données publics via des API ou téléchargements directs.
- Accès sécurisé aux données propriétaires d’Orange pour les expérimentations.
about you
- Étudiant(e) en dernière année d’école d’ingénieur, de master en IA/Data Science.
- Une expérience pratique en programmation Python, notamment avec des bibliothèques telles que pandas, numpy, scikit-learn, (TensorFlow ou PyTorch si nécessaire), et être à l’aise dans la création d’environnements virtuels (poetry, pyenv, uv).
- Rigueur dans l’établissement du plan d’expériences et dans le développement afin de permettre de reproduire les résultats d’expérience.
- Curiosité, autonomie, esprit de recherche, capacité à vulgariser.
- Un intérêt particulier pour les modèles de deep learning, notamment les architectures Transformer, et leur application aux séries temporelles.
- Une curiosité pour les nouvelles technologies et une capacité à se tenir à jour sur l’état de l’art scientifique.
- Une bonne capacité d’analyse, de synthèse et de communication pour rédiger des rapports techniques et des recommandations.