
Activez les alertes d’offres d’emploi par e-mail !
Générez un CV personnalisé en quelques minutes
Décrochez un entretien et gagnez plus. En savoir plus
Une entreprise technologique mondiale recherche un stagiaire en ingénierie IA pour un stage de 6 mois. Vous travaillerez sur l'adaptation de modèles de questions-réponses pour des domaines à faibles ressources, avec un accent sur la génération synthétique de données QA. En intégrant une équipe d'experts, le stagiaire participera à la recherche et au développement de nouveaux produits dans un environnement stimulant.
AI Engineer Intern (6 months)
Adaptation de domaine à faible ressource guidée par l'incertitude pour les systèmes de questions-réponses.
Nous sommes une entreprise technologique mondiale, moteur de l'innovation énergétique pour un équilibre planétaire.
Chez SLB, nous créons des technologies incroyables qui ouvrent l'accès à l'énergie au bénéfice de tous. C'est notre raison d'être. En tant qu'innovateurs, c'est notre mission depuis 100 ans. Nous faisons face au plus grand défi d'équilibre au monde : réduire simultanément les émissions tout en répondant à la demande croissante en énergie. Nous travaillons chaque jour pour trouver des solutions, un pas après l'autre.
Notre avenir collectif dépend de la décarbonisation de l'industrie des énergies fossiles, tout en innovant dans un nouveau paysage énergétique. C'est ce qui nous motive. Assurer le progrès pour les personnes et la planète, dans un cheminement vers la neutralité carbone et au-delà. Pour un équilibre planétaire.
Ensemble, nous créons des technologies incroyables qui ouvrent l'accès à l'énergie au bénéfice de tous. Vous pouvez en savoir plus sur nous via ce lien: https://www.slb.com/who-we-are.
Clamart, Paris
Questions-Réponses (QA) spécifiques à un domaine cela permet aux praticiens d’interroger des documents techniques tels que des manuels pétroliers et gaziers ou des rapports de sécurité. Cependant, former des systèmes QA efficaces dans ces domaines est difficile en raison de la rareté des données annotées. Bien que les grands modèles de langage pré-entraînés (LLMs) tels que ChatGPT ou LLaMA soient de puissants généralistes, ils rencontrent souvent des difficultés avec le vocabulaire spécialisé et le raisonnement spécifique à un domaine. Cela soulève le défi central de ce stage : comment adapter les modèles QA à de nouveaux domaines avec un minimum de données annotées, tout en restant robustes face aux hallucinations ?
La création de jeux de données QA annotés est coûteuse et chronophage, car des experts du domaine doivent concevoir les questions et identifier des réponses précises. Bien qu’une abondante documentation non structurée existe dans des domaines tels que le pétrole et le gaz, les paires QA annotées par des experts restent rares. Un ajustement direct sur un petit nombre d’exemples annotés par des humains risque de conduire à un surapprentissage (overfitting) et à un oubli catastrophique
Parallèlement, les hallucinations dans les réponses des LLM posent de sérieux risques, car des réponses incorrectes mais formulées avec assurance peuvent induire les praticiens en erreur dans des environnements critiques.
Des recherches récentes ont commencé à intégrer l’incertitude dans le processus de fine-tuning des grands modèles. Par exemple, les fonctions de perte tenant compte de l’incertitude (uncertainty-aware loss functions) calibrent la confiance du modèle en pénalisant les erreurs excessivement confiantes et en encourageant l’incertitude sur les entrées ambiguës
D’un point de vue bayésien, des a priori tenant compte de l’incertitude pendant le fine-tuning ont amélioré la fiabilité et la robustesse des modèles fondamentaux en vision et langage
En parallèle, des approches de fine-tuning prudentes ou « pessimistes » diminuent explicitement le poids des générations à haut risque pour atténuer les résultats rares mais préjudiciables
Cependant, à notre connaissance, aucun travail antérieur n’a unifié ces directions dans un cadre cohérent adapté aux QA spécifiques à un domaine — en particulier un cadre combinant la génération synthétique de paires QA avec des objectifs tenant compte de l’incertitude et du pessimisme pendant le fine-tuning.
Au cours de ce stage, le ou la candidate sélectionné(e) explorera et proposera un cadre novateur pour l’adaptation de modèles QA à faible ressource dans des domaines spécifiques, motivé par des applications critiques telles que le pétrole et le gaz. L’approche s’appuiera sur la génération synthétique de paires QA à partir de documents spécifiques au domaine, tout en introduisant des mécanismes de fine-tuning tenant compte de l’incertitude et du pessimisme.
Le/la stagiaire bénéficiera de l’accompagnement des ingénieurs en intelligence artificielle du SLB AI Lab et sera pleinement intégré(e) à l’équipe NLP. Le stage débutera par une revue de l’état de l’art, suivie d’une compréhension du contexte métier, avant de passer aux phases de recherche, de création de prototypes et de tests.
Le/la stagiaire aura l’opportunité de s’engager dans des recherches théoriques et appliquées de haut niveau dans ce domaine. Il/elle contribuera au développement de nouveaux produits et collaborera avec des experts projets et des data scientists au sein du AI Lab ainsi qu’avec diverses équipes de SLB à travers le monde.
SLB est un employeur offrant l'égalité des chances en matière d'emploi. Les candidats qualifiés sont considérés sans distinction de race, de couleur, de religion, de sexe, d'orientation sexuelle, d'identité de genre, d'origine nationale, d'âge, de handicap ou d'autres caractéristiques protégées par la loi.
Le processus de recrutement et le poste peuvent être adaptés pour répondre à la plupart des handicaps. N'hésitez pas à le mentionner lors de votre candidature.