
Activez les alertes d’offres d’emploi par e-mail !
Une entreprise de télécommunications recherche un stagiaire pour une durée de 6 mois dans le domaine de l'apprentissage machine. Le candidat idéal doit avoir un Bac+5 avec de solides connaissances en machine learning et programmation Python. Les activités incluent l'étude des méthodes de réglage renforcé et la proposition d'améliorations pour des cas d'utilisation en télémétrie réseau. Un stage rémunéré avec prise de poste souhaitée le 02 février 2026.
Context: AI agents are booming. Aligning their behavior as closely as possible with desired objectives is becoming a crucial issue. However, these objectives are often complex and difficult to express explicitly. Approaches such as Reinforcement Learning from Human Feedback (RLHF) or, more recently, Group Relative Policy Optimization (GRPO) allow for the adjustment of an agent's behavior by leveraging human feedback, rewards, etc. The purpose of this internship is to evaluate and develop these types of techniques in the specific context of network telemetry.
La Direction Orange Innovation Networks définit et pilote la stratégie et la politique réseau du groupe, organise et coordonne les travaux d'architecture de bout en bout couvrant terminaux, réseaux, plates-formes de service et système d'information. Elle assure la prise en compte de la stratégie du groupe dans les standards (en lien avec des partenaires industriels ou académiques) et les produits des industriels choisis par le groupe. Elle assure la conception des solutions et briques techniques réseaux pour les pays.
Au sein d'Orange Innovation Networks, la direction Wireline Networks Infrastructures (WNI), définit et pilote la stratégie d'évolution des réseaux fixes ainsi que la politique d'équipement du Groupe pour les domaines concernés en :
L'équipe ROUTING est en charge de proposer en normalisation, évaluer et recommander aux entités opérationnelles du groupe les solutions relatives au plan de contrôle et aux protocoles de routage des réseaux IP/MPLS. L'équipe travaille aussi sur les outils de monitoring et sur les aspects sécurité du domaine.