Activez les alertes d’offres d’emploi par e-mail !
Générez un CV personnalisé en quelques minutes
Décrochez un entretien et gagnez plus. En savoir plus
Le CNRS recherche un(e) postdoctorant(e) spécialisé(e) en intelligence artificielle pour travailler sur des outils pour les sciences omiques. Le/la candidat(e) devra développer des outils open-source, encadrer des chercheurs et collaborer avec des équipes internationales. Une expertise en programmation Python et en technologies du web sémantique est essentielle pour ce poste basé en Provence-Alpes-Côte d'Azur.
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
CDD d'1 an
Missions :
Dans le cadre du projet ANR de Louis-Félix Nothias, du projet ANR SNF MetaboLinkAI, et en collaboration avec l'équipe Wimmics (INRIA Sophia Antipolis), l'HolobiomicsLab recrute un chercheur postdoctoral (H/F) pour développer des outils génériques et ouverts d'intelligence artificielle dédiés aux sciences omiques, avec une application privilégiée aux systèmes holobiontes marins. Ce projet vise à révolutionner l'accès aux connaissances multi-omiques en combinant graphes de connaissances sémantiques et modèles de langage de grande taille (LLMs) dans un cadre collaboratif international.
Le/la postdoctorant(e) contribuera au développement d'un écosystème d'outils open-source permettant l'analyse intégrée de données métabolomiques, protéomiques et génomiques dans le contexte des interactions hôte-microbiome des organismes marins. Ces outils représentent les informations expérimentales issues de données de spectrométrie de masse et d'autres techniques omiques dans un cadre standardisé (RDF), permettent des requêtes avancées de fouille de données (SPARQL), et fournissent des interfaces en langage naturel pour interroger efficacement les graphes de connaissances multi-omiques.
L'objectif principal est de développer une suite d'outils génériques et modulaires, tout en explorant de nouvelles représentations de graphes de connaissances (ArangoDB, GraphRAG, ...) et des architectures d'agents hybrides pour supporter des analyses moléculaires complexes d'holobiontes. Le poste inclut des responsabilités de co-encadrement scientifique de doctorants et d'ingénieurs de recherche.
Activités :
1. Développement d'outils génériques et ouverts pour l'IA scientifique
Le/la postdoctorant(e) contribuera au développement d'une suite d'outils génériques et open-source pour l'intelligence artificielle appliquée aux sciences omiques, en étroite collaboration avec les équipes nationales et internationales du consortium. Cette approche collaborative favorisera l'émergence de solutions réutilisables et interopérables, s'appuyant sur des standards ouverts et des architectures modulaires. Le développement d'approches déclaratives innovantes permettra de découpler le workflow de l'assistant du graphe de connaissances spécifique, avec l'objectif ambitieux de passer d'un prototype dédié à la chimie vers une solution véritablement indépendante du domaine. L'architecture logicielle modulaire constituera un enjeu majeur pour permettre l'adaptation rapide à différents domaines scientifiques et représentations de graphes de connaissances, incluant l'exploration de technologies émergentes comme ArangoDB, GraphRAG et les architectures d'agents hybrides.
2. Conception collaborative d'une bibliothèque d'outils et encadrement scientifique
Dans un cadre résolument collaboratif, le/la postdoctorant(e) dirigera la conception et l'implémentation d'une bibliothèque d'outils complète permettant d'effectuer des tâches génériques essentiel
Voir plus sur le site emploi.cnrs.fr...
Competences :
Compétences techniques
Formation : Doctorat en informatique, intelligence artificielle, bioinformatique ou domaine connexe avec expertise en IA et/ou sciences omiques.
Programmation : Maîtrise avancée de Python, expérience avec le développement d'applications IA et les APIs de LLMs.
Graphes de connaissances : Expertise en technologies du web sémantique (RDF, OWL, SPARQL), Linked Data, et ouverture vers les bases de données orientées graphes (ArangoDB, Neo4j, GraphDB).
Intelligence artificielle : Solide compréhension des modèles de langage de grande taille, techniques d'apprentissage automatique, architectures conversationnelles, GraphRAG et agents hybrides.
Sciences omiques : Experience avec le traitement des données en lien avec la chimie et la métabolomique.
Développement logiciel : Expérience en ingénierie logicielle, gestion de version (Git), développement collaboratif open-source, et architectures modulaires.
Encadrement : Expérience ou intérêt pour l'encadrement scientifique de jeunes chercheurs et la formation aux technologies émergentes.
Compétences transversales
Collaboration interdisciplinaire : Capacité à travailler efficacement avec des équipes pluridisciplinaires (informaticiens, chimistes, biologistes).
Communication scientifique : Excellentes compétences en rédaction scientifique et présentation (publications, conférences internationales).
Autonomie et leadership : Capacité à conduire des projets de recherche de manière autonome et à proposer des solutions innovantes.
Langues : Maîtrise de l'anglais scientifique (écrit et oral), français apprécié.
Adaptabilité : Capacité d'adaptation aux évolutions rapides des technologies IA et aux besoins des utilisateurs scientifiques.
Contraintes et risques :
Complexité technologique : Développement sur des technologies IA en évolution rapide nécessitant une veille technologique constante et une adaptation continue des méthodes.
Intégration système : Travail sur des architectures logicielles complexes intégrant multiple composants (LLMs, bases de données, interfaces web) requérant une rigueur exemplaire dans la conception et les tests.
Collaboration internationale : Coordination avec des équipes distantes (France-Suisse) impliquant des réunions virtuelles régulières et une communication asynchrone efficace.
Livrables de recherche : Pression pour produire des résultats scientifiques de haute qualité dans les délais impartis, avec publication dans des venues internationales compétitives.
Ergonomie numérique : Travail intensif sur écran nécessitant le respect des bonnes pratiques ergonomiques et la gestion des risques liés au travail numérique prolongé.
Sécurité informatique : Manipulation de données sensibles et intégration d'APIs externes nécessitant le respect strict des protocoles de sécurité informatique du laboratoire.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16000 chercheurs et plus de 16000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.