Activez les alertes d’offres d’emploi par e-mail !

Job offer

Laboratoire d'Informatique Fondamentale et Appliquée de Tours

France

Sur place

EUR 40 000 - 60 000

Plein temps

Il y a 30+ jours

Mulipliez les invitations à des entretiens

Créez un CV sur mesure et personnalisé en fonction du poste pour multiplier vos chances.

Résumé du poste

Cette thèse passionnante se concentre sur le développement de techniques de détection multimodale pour lutter contre la désinformation. En collaboration avec des chercheurs, vous explorerez des concepts d'intelligence artificielle pour identifier des contenus multimédias. Vous aurez l'occasion de travailler sur des projets innovants qui allient vision par ordinateur et traitement du langage naturel, tout en tenant compte de l'impact sociétal des outils développés. Ce projet offre une opportunité unique de contribuer à des recherches significatives dans un domaine en pleine évolution, avec un fort accent sur l'explicabilité des algorithmes et l'interaction citoyenne.

Qualifications

  • M2 en informatique ou diplôme d’ingénieur requis.
  • Bonnes connaissances en Machine Learning et IA indispensables.

Responsabilités

  • Conception et évaluation de techniques de détection multimodale.
  • Exploration de concepts d’IA pour la vérification de faits.

Connaissances

Machine Learning
Intelligence Artificielle
Programmation
Développement Web
Communication

Formation

M2 en informatique
Diplôme d’ingénieur

Description du poste

Laboratoire d'Informatique Fondamentale et Appliquée de Tours

Contexte

Cette offre de thèse s'inscrit dans le cadre du projet « Fact Checking » mené depuis 2021 entre le laboratoire LIFAT et l’équipe PRIM. Le fact checking, ou vérification de fait, consiste à vérifier la véracité des faits présentés dans les médias par des personnalités publiques ou autres organisations.

De nombreux travaux de recherches ont été et sont en train d’être menés pour répondre à l’enjeu majeur de la désinformation, notamment depuis l’avènement des technologies de deep-fake et d’IA génératives. Ce phénomène de désinformation massive est observable dans plusieurs domaines : on peut citer en particulier la sphère politique, le changement climatique ou encore le domaine de santé.

Au cours de la dernière décennie, des progrès significatifs ont été réalisés dans les domaines du « Computer Vision » (CV) et du « Natural Language Processing » (NLP), en grande partie grâce au succès des réseaux neuronaux. Ainsi, c’est tout naturellement que l’aspect multimodal (apprentissage conjoint des modalités) mêlant la CV et le NLP ont été étudiés récemment, avec succès dans des tâches telles que la réponse visuelle aux questions, le sous-titrage d'images ou de vidéos.

Objectifs de la thèse

Cette thèse vise à la conception et à l’évaluation de nouvelles techniques de détection multimodale (vidéo, image, audio, texte) dans du contenu multimédia. Pour ce faire, la thèse explorera l’utilisation de concepts d’IA à différents niveaux : « Audio-visual Active Speaker identification » (ASD), « Multimodal Named Entity recognition » (MNER), « Retrieval-Augmented Generation » (RAG), etc., et l’exploitation d’une base de données de fait vérifiés existante.

Par ailleurs, compte-tenu de l’impact sociétal de ces travaux, un fort accent sera mis sur l’explicabilité des algorithmes multimodaux proposés, en agrégant différentes solutions : récupération d’information tierces via la recherche d’information, génération textuelle, visualisation d’élément saillant dans les images/vidéos, isolation des séquences d’intérêt dans les pistes audio/vidéos, etc.

Enfin, durant la réalisation de ces travaux de recherche, il s’agira aussi de tenir compte des verrous théoriques et empiriques de l’acception des citoyens d’un tel outil via les notions d’interactions avec les outils développés, et de visualisation interactive et d’ergonomie. Ces aspects seront abordés via une collaboration avec des chercheurs en sciences de l’information et de la communication ou des journalistes et fact-checkers.

Bibliographie (indicative)

[1] Rayar F. FrenchFacts: A French Dataset of Fact-Checked Claims. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING). 2024 (Accepted).

[2] Rayar F. Fact-Checked Claim Detection in Videos Using a Multimodal Approach. In Proceedings of the 19th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISAPP), 614-620. 2024.

[3] Rayar F. et Nicey J. Détecter et contextualiser le faux dans les énoncés politiques en télévision : conception d’un dispositif multimodal de vérification. Infox sur Seine. 2023.

[4] Rayar F., Delalandre M., and Le V-H. A large-scale TV video and metadata database for French political content analysis and fact-checking. In Proceedings of the 19th International Conference on Content-based Multimedia Indexing (CBMI), 181–185. 2022.

[5] Guo, Z., Schlichtkrull, M., and Vlachos, A. A survey on automated fact-checking. Transactions of the Association for Computational Linguistics, 10:178. 2023.

[6] Akhtar M., Schlichtkrull M., Guo, Z., Cocarascu, O., Simper E., and Vlachos, A. Multimodal automated fact-checking: A survey. 2023.

[7] Kotonya, N. and Toni, F. Explainable automated fact-checking: A survey. CoRR, abs/2011.03870. 2020.

Conditions requises

- M2 en informatique ou diplôme d’ingénieur

- Bonnes connaissances en Machine Learning et Intelligence Artificielle

- Bonnes connaissances en programmation indispensables

- Des compétences en développement web sont souhaitables

- Bonnes capacités de communication et de rédaction, en particulier en anglais

Informations supplémentaires

Nombre d'offres disponibles : 1

Institut : Laboratoire d'Informatique Fondamentale et Appliquée de Tours

Pays : France

Ville : Tours

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.