Activez les alertes d’offres d’emploi par e-mail !

Evaluation and Development of Reinforcement Fine-Tuning Techniques for Network Telemetry AI Age[...]

Orange

Châtillon

Sur place

EUR 20 000 - 40 000

Plein temps

Hier
Soyez parmi les premiers à postuler

Résumé du poste

Une entreprise de télécommunications recherche un stagiaire pour une durée de 6 mois dans le domaine de l'apprentissage machine. Le candidat idéal doit avoir un Bac+5 avec de solides connaissances en machine learning et programmation Python. Les activités incluent l'étude des méthodes de réglage renforcé et la proposition d'améliorations pour des cas d'utilisation en télémétrie réseau. Un stage rémunéré avec prise de poste souhaitée le 02 février 2026.

Prestations

Stage rémunéré

Qualifications

  • Bac+5 requis.
  • Bonne connaissance des méthodes d'apprentissage machine et de programmation en Python.
  • Capacité à travailler de manière autonome et proactive.
  • Capacité à formaliser et communiquer des résultats.

Responsabilités

  • Étudier les méthodes de réglage renforcé.
  • Évaluer et comparer la performance des approches sélectionnées.
  • Proposer des améliorations, y compris de nouvelles fonctions de récompense.

Connaissances

Connaissance en apprentissage machine
Programmation (Python)
Autonomie
Proactivité
Communication efficace

Formation

Bac+5
Description du poste
Votre rôle

Context: AI agents are booming. Aligning their behavior as closely as possible with desired objectives is becoming a crucial issue. However, these objectives are often complex and difficult to express explicitly. Approaches such as Reinforcement Learning from Human Feedback (RLHF) or, more recently, Group Relative Policy Optimization (GRPO) allow for the adjustment of an agent's behavior by leveraging human feedback, rewards, etc. The purpose of this internship is to evaluate and develop these types of techniques in the specific context of network telemetry.

Activities
  • Study reinforcement fine-tuning methods.
  • Evaluate and compare the performance of the selected approaches on different use cases related to network telemetry.
  • Propose improvement, such as new reward functions or new architectures.
Votre profil
  • Bac+5.
  • You have good knowledge of machine learning and programming (python).
  • You are capable of autonomy, pro activity and you know how to put your ideas into practice.
  • You know how to formalize your results and communicate effectively.
Entité

La Direction Orange Innovation Networks définit et pilote la stratégie et la politique réseau du groupe, organise et coordonne les travaux d'architecture de bout en bout couvrant terminaux, réseaux, plates-formes de service et système d'information. Elle assure la prise en compte de la stratégie du groupe dans les standards (en lien avec des partenaires industriels ou académiques) et les produits des industriels choisis par le groupe. Elle assure la conception des solutions et briques techniques réseaux pour les pays.

Au sein d'Orange Innovation Networks, la direction Wireline Networks Infrastructures (WNI), définit et pilote la stratégie d'évolution des réseaux fixes ainsi que la politique d'équipement du Groupe pour les domaines concernés en :

  • fournissant aux entités des architectures optimisées
  • soutenant les entités opérationnelles des filiales dans l'implémentation des évolutions du réseau
  • pilotant les travaux de recherche et d'anticipation pour préparer le Groupe aux évolutions tendancielles et en rupture sur le réseau.

L'équipe ROUTING est en charge de proposer en normalisation, évaluer et recommander aux entités opérationnelles du groupe les solutions relatives au plan de contrôle et aux protocoles de routage des réseaux IP/MPLS. L'équipe travaille aussi sur les outils de monitoring et sur les aspects sécurité du domaine.

Contrat
  • Stage
  • Durée : 6 months
  • Date souhaitée de prise de poste : 02 févr. 2026
  • Niveau d'études préparées pendant ce stage : Master 2
  • Stage rémunéré
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.