Overview
Afin de répondre à nos ambitions et challenges, l'équipe Data est à la recherche d’un·e stagiaire Data Scientist. L'équipe est composée de: Quentin & Vincent - Data Engineer; Christopher, Leeroy & Guillaume - Data Analyst; Alexandre & Alexandre - Data Scientist; Soizic - Chief Data Officer. Nous cherchons une nouvelle pépite pour rejoindre cette belle équipe.
Objectif du stage
Optimiser un algorithme capable de détecter automatiquement les maisons de luxe à partir de plusieurs sources de données (descriptions, données géographiques, photos), avec à la clé :
- Une meilleure recommandation pour nos utilisateurs haut de gamme,
- Une valorisation commerciale plus ciblée,
- Un gain de temps opérationnel pour les équipes terrain (Collection Team).
Il y aura 4 phases, en collaboration avec l’équipe Collection pour valider les résultats :
Phases du stage
- Audit : Compréhension du projet existant et des limites des solutions actuelles; Identification des nouveaux objectifs attendus avec l’équipe Collection.
- Ré-entrainement : Réentraîner les modèles existants sur les données les plus récentes; Ajuster les seuils de détection pour optimiser le ratio pertinence / volume; Mettre à jour les dashboards de suivi des performances.
- Amélioration de l’architecture actuelle : Identifier des pistes d’amélioration et évaluer les gains; Développement, entraînement et mise en production du modèle amélioré; Documenter les évolutions.
- Automatisation de l'entraînement : Mise en place d’un pipeline d’entraînement automatisé pour suivre, rejouer et comparer les expérimentations (MLFlow, Sagemaker); Tracking des métriques, optimisation des hyperparamètres, et versionnement des artefacts (modèles, datasets…).
En fonction de la durée du stage, un projet de recommandation pourra compléter les missions.
Stack & compétences recherchées
- Modélisation & machine learning : scikit-learn, LightGBM
- Traitement de texte : NLP, embeddings, TF-IDF, BERT
- Computer vision (optionnel) : PyTorch, DINOv2
- Manipulation de données : pandas, SQL, dbt
- Visualisation & évaluation : seaborn, matplotlib, plotly
- Notions MLOps appréciées : MLflow, Airflow, Airbyte, dockerisation
- Étudiant·e en fin d’études (M2 ou césure) en data science, statistiques, IA ou équivalent
- Solide culture data, curiosité pour la donnée non structurée (images, textes, géoloc)
- Bon esprit d’analyse, rigueur scientifique, goût pour l’exploration
- Intérêt pour le secteur touristique est un plus
Égalité des chances et inclusion : HomeExchange et son équipe s’engagent à promouvoir la Diversité et l’Inclusion, en cultivant un environnement de travail respectueux et accueillant. Chaque candidature sera étudiée avec soin; n’hésitez plus, postulez !
Avantages
- Titres restaurants
- 1000 euros Brut / mois
- Abonnement à notre plateforme
- Mutuelle Alan (remboursement à 75%)
- Afterworks, petits-déjeuners et autres moments de partage
- Locaux agréables, dans Paris Intra Muros
- Une équipe soudée et sympa