Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

STAGE - Ingénieur en apprentissage par renforcemen H/F (Stage)

Thales

Palaiseau

Sur place

EUR 40 000 - 55 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une société de haute technologie située à Palaiseau recherche un chercheur pour travailler sur des jeux multi-agents à information incomplète. Le candidat idéal doit avoir une solide expérience en recherche sur les algorithmes d'apprentissage par renforcement et en théorie des jeux. Vous contribuerez à des projets innovants en IA, avec un accent sur les techniques avancées pour améliorer des méthodes existantes. Un environnement inclusif et des opportunités de développement professionnel sont offerts.

Prestations

Engagement sociétal et environnemental
Environnement de travail inclusif
Flexibilité de travail

Qualifications

  • Expérience en recherche sur les jeux à information incomplète.
  • Compétences en algorithmes d'apprentissage par renforcement.
  • Connaissances en théories des jeux et des techniques CFR.

Responsabilités

  • Reproduire des principes de techniques d'apprentissage par renforcement dans les jeux multi-agents.
  • Travail sur l'état de l'art des jeux à information incomplète.
  • Développer des méthodes de recherche adaptées à la complexité des jeux.

Connaissances

Jeux multi-agents
Apprentissage par renforcement
Théorie des jeux
Estimation de croyances
Description du poste

Chez Thales, nous sommes fiers de travailler ensemble pour imaginer des solutions innovantes qui contribuent à construire un avenir plus sûr, plus vert et plus inclusif. Un avenir de confiance. Mais ces technologies ne viennent pas de nulle part. L'intelligence humaine est le moteur derrière la technologie qui fait la renommée de Thales. Les projets que nous conduisons sont complexes et nos clients exigeants. Pour répondre aux besoins actuels et futurs de nos clients, nous maîtrisons plus d'une centaine de disciplines, de l'optique à la physique quantique, du traitement du signal à la connectivité et à l'intelligence artificielle. Rejoindre Thales, c'est repousser les limites de la technologie et la mettre au service du progrès et du développement durable de nos sociétés. C'est donc être au coeur d'une formidable aventure technique. Une attention portée à l'équilibre des collaborateurs au service de leur réussite. C'est pourquoi, notamment, nous nous efforçons de créer un environnement de travail accueillant et d'accorder la flexibilité nécessaire à l'équilibre entre vie professionnelle et vie personnelle. Nous savons que cet équilibre est essentiel à votre épanouissement et à la réussite des projets que nous vous confierons. Des parcours professionnels riches. Chez Thales, nous jouons collectif. Ce qui signifie travailler en équipe, côtoyer des experts et donc apprendre et développer ses compétences en permanence tout en faisant bénéficier le Groupe de son savoir-faire. C'est aussi la possibilité d'évoluer, de changer de fonction ou d'activité, voire de pays.

Lieu : Palaiseau, France
Construisons ensemble un avenir de confiance

Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus inclusif. Le Groupe investit près de 4 milliards d'euros par an en Recherche & Développement, notamment dans des domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays.

Nos engagements, vos avantages
  • Notre savoir-faire technologique
  • Notre attention portée à l'équilibre des collaborateurs
  • Un environnement inclusif et bienveillant
  • Un engagement sociétal et environnemental reconnu (Thales Solidarity, indice CAC 40 ESG…)
Votre quotidien

Thales Research&Technology, notre centre de recherche dans les domaines matériels, et CortAIx Labs, notre centre de recherche en IA et digital ont pour mission de proposer des innovations de ruptures, de maintenir et d'accroitre l'avance technologique et d'en assurer la compétitivité pour le groupe.

Résoudre des jeux multi‑agents à information incomplète (contrairement aux échecs ou au go) est un défi majeur : chaque agent doit raisonner avec de l’incertitude sur l’état réel du jeu et sur les intentions des adversaires. Les approches de type Counterfactual Regret Minimization (CFR) ont montré leur efficacité lorsque la combinatoire reste limitée. Plus récemment, des travaux de pointe de Google Deepmind en 2023 ont démontré qu’un apprentissage par renforcement et des architectures dédiées peuvent atteindre un niveau expert sur des jeux à très grande combinatoire comme Stratego.

Votre objectif sera de reproduire les principes de ces approches de pointe sur le jeu Zenith (multi‑agents, information incomplète, complexité intermédiaire). L’enjeu sera de dépasser les limites des méthodes CFR pures en s’appuyant sur des techniques d’apprentissage par renforcement et de recherche mieux adaptées à ce cadre.

Dans ce contexte, vous aurez pour missions :

  • État de l’art : jeux à information incomplète, CFR/Deep‑CFR, self‑play, régularisation/équilibres, estimation de croyances…
  • Le profil recherché (compétences et l’expérience requises) est détaillé dans le Descriptif du poste ci-dessus
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.