Activez les alertes d’offres d’emploi par e-mail !
Un institut de recherche en informatique recherche un doctorant pour développer des modèles d'apprentissage automatique sur des données tabulaires. Le candidat idéal possède de solides compétences en mathématiques et en Python, avec un intérêt marqué pour la recherche. Le poste offre des conditions de travail favorables, y compris la possibilité de télétravail et des avantages sociaux compétitifs.
Contexte et atouts du poste
Cette proposition de thèse se concentre sur les modèles de fondation tabulaires : des modèles d'apprentissage automatique pré-entraînés pour les données tabulaires. En particulier, cette proposition se concentrera sur des architectures neuronales adaptées aux données relationnelles d'entrée, comprenant des types multiples (chaînes, nombres, dates...) souvent répartis sur plusieurs tables. Pour modéliser ces données, nous utiliserons une architecture flexible basée sur les réseaux attentionnels graphiques. Le défi sera de sélectionner le graphe et l'architecture appropriés pour appliquer le contexte pertinent.
Mission confiée
Avec l'aide de Gael Varoquaux, la personne recrutée effectuera une recherche doctorale en apprentissage statistique pour développer des modèles tabulaires.
Le but de cette proposition de thèse est de construire des architectures d'apprentissage capables de s'adapter à divers types de données relationnelles, afin de 1) être pré-entraînées sur de vastes sources de données, 2) se transférer vers de nouvelles tables et bases de données relationnelles sans nécessiter trop de traitement des données. L'objectif initial sera de concevoir une architecture basée sur un transformer qui modélise naturellement les différents types d'entrée : chaînes, dates et nombres. Par la suite, cette architecture sera adaptée à plusieurs tables.
Principales activités
Compétences
Avantages
Rémunération
2200€ brut / mois