Activez les alertes d’offres d’emploi par e-mail !

Doctorant F / H Modèle de fondation tabulaire

INRIA

Palaiseau

Hybride

EUR 60 000 - 80 000

Plein temps

Il y a 4 jours
Soyez parmi les premiers à postuler

Résumé du poste

Un institut de recherche en informatique recherche un doctorant pour développer des modèles d'apprentissage automatique sur des données tabulaires. Le candidat idéal possède de solides compétences en mathématiques et en Python, avec un intérêt marqué pour la recherche. Le poste offre des conditions de travail favorables, y compris la possibilité de télétravail et des avantages sociaux compétitifs.

Prestations

Restauration subventionnée
Transports publics remboursés partiellement
7 semaines de congés annuels + 10 jours de RTT
Possibilité de télétravail
Accès à la formation professionnelle

Qualifications

  • Solide bagage en mathématiques, en particulier en statistiques et machine learning.
  • Maîtrise de Python, connaissance de PyTorch un plus.
  • Bonne maîtrise écrite de l'anglais et esprit curieux.

Responsabilités

  • Effectuer une recherche doctorale en apprentissage statistique.
  • Développer des modèles d'apprentissage pour des données tabulaires.
  • Suivre la littérature et publier les résultats.

Connaissances

Mathématiques solides
Machine learning
Python
Connaissance de PyTorch
Maîtrise écrite de l'anglais
Esprit curieux

Description du poste

Contexte et atouts du poste

Cette proposition de thèse se concentre sur les modèles de fondation tabulaires : des modèles d'apprentissage automatique pré-entraînés pour les données tabulaires. En particulier, cette proposition se concentrera sur des architectures neuronales adaptées aux données relationnelles d'entrée, comprenant des types multiples (chaînes, nombres, dates...) souvent répartis sur plusieurs tables. Pour modéliser ces données, nous utiliserons une architecture flexible basée sur les réseaux attentionnels graphiques. Le défi sera de sélectionner le graphe et l'architecture appropriés pour appliquer le contexte pertinent.

Mission confiée

Avec l'aide de Gael Varoquaux, la personne recrutée effectuera une recherche doctorale en apprentissage statistique pour développer des modèles tabulaires.

Le but de cette proposition de thèse est de construire des architectures d'apprentissage capables de s'adapter à divers types de données relationnelles, afin de 1) être pré-entraînées sur de vastes sources de données, 2) se transférer vers de nouvelles tables et bases de données relationnelles sans nécessiter trop de traitement des données. L'objectif initial sera de concevoir une architecture basée sur un transformer qui modélise naturellement les différents types d'entrée : chaînes, dates et nombres. Par la suite, cette architecture sera adaptée à plusieurs tables.

Principales activités

  • Faire de la recherche sur les modèles tabulaires, notamment les modèles de fondation
  • Suivre la littérature dans le domaine
  • Publier les résultats et les présenter

Compétences

  • Solide bagage en mathématiques : statistiques, machine learning
  • Maîtrise de Python
  • La connaissance de PyTorch est un plus
  • Esprit curieux. Bonne maîtrise écrite de l'anglais

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés : 7 semaines de congés annuels + 10 jours de RTT (temps plein) + autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et d'aménagement du temps de travail
  • Équipements professionnels (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Rémunération

2200€ brut / mois

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.