Larka recherche ses futurs collaborateurs !
Parce que nous souhaitons bâtir le Larka de demain autour de jeunes talents curieux, motivés et créatifs, nous cherchons un Data Scientist Junior pour un stage de 6 mois.
Qui nous sommes ?
Basé à Nice, Larka est un cabinet de conseil en management spécialisé dans l’industrie Biotech & Pharma. Nous accompagnons les grands groupes pharmaceutiques, Biotech, fonds d’investissement et institutions publiques dans leur croissance et orientations stratégiques. Grâce à notre expertise scientifique, commerciale et à l’utilisation de technologies avancées – telle que l’intelligence artificielle –, nous aidons nos clients à surmonter des défis économiques, technologiques et stratégiques.
Vos missions
Vous serez au cœur du développement de notre Knowledge Center, une plateforme stratégique qui soutient à la fois le travail interne de nos consultants et nos clients en tant que produit à part entière.
Ce Knowledge Center permet un monitoring en temps réel et à 360° de l’écosystème Biotech & Pharma, couvrant notamment les événements de financement, les opérations de M&A, les composés en essais cliniques et les produits commercialisés.
A. Compréhension des besoins métiers et techniques
Votre première mission consistera à analyser et comprendre les besoins des différentes parties prenantes :
- Équipe de développement : identification et résolution des problématiques techniques
- Équipe de gestion de projet : optimisation des processus et des flux de travail
- Équipe produit : contribution au développement des produits
B. Mise en œuvre de pipelines de données
- Développement de solutions de web scraping avancé à l’aide de Scrapy, Beautiful Soup, Selenium ou Pyppeteer
- Extraction de données structurées et non structurées à partir de sources variées (API, fichiers texte, bases de données, article de presse etc.)
- Nettoyage, normalisation et enrichissement des données afin d’en garantir la qualité et la cohérence
C. Conception, entraînement et déploiement de modèles d’IA
- Labellisation, constitution de jeux de données d'entraînement et contrôle.
- Développement de modèles de machine learning, avec un fort accent la classification et le clustering
- Utilisation d'API d'LLM, prompt engineering
- Développement d'agents IA
- Construction de pipelines de bout en bout pour des architectures avancées telles que le Retrieval-Augmented Generation (RAG)
D. Veille technologique, maintenance des systèmes
- Veille active sur les nouvelles technologies en data science, intelligence artificielle, scraping
- Maintien et optimisation continue des systèmes existants
Travailler chez Larka
Rejoindre Larka, c'est intégrer une équipe où le développement professionnel et personnel est une priorité. Nous valorisons le bien-être de nos collaborateurs à travers des conditions de travail optimales et une reconnaissance adaptée à chaque parcours. Nous nous engageons donc à fournir un environnement de travail motivant et des avantages divers, parmi lesquels :
- Un cadre de travail flexible et convivial
- Des activités sportives hebdomadaires
- Des bureaux idéalement situés en plein cœur de Nice
- Des séminaires réguliers
- Des afterworks en bord de mer
Votre profil
Vous êtes en dernière année d'école d'ingénieur avec une spécialisation en IA/Machine Learning.
Hard Skills :
- Maîtrise de Python et de ses bibliothèques associées (pandas, NumPy, scikit-learn, TensorFlow, PyTorch)
- Solide expérience en Traitement du Langage Naturel (NLP)
- Configuration et intégration de LLMs (ex. BERT, LLAMA, GPT) au sein d’architectures RAG afin de générer des réponses enrichies à partir de contextes extraits
- Conception de processus efficaces de pré-traitement, d’indexation et de recherche, basés sur des métriques avancées (similarité cosinus, distances pondérées, etc.)
- Expertise dans le fine-tuning de modèles pré-entraînés (ex. BERT, LLAMA, GPT) pour des tâches telles que la reconnaissance d’entités nommées (NER), la classification ou la génération de texte
- Expérience dans le déploiement de modèles d’IA en production, via des APIs ou des outils tels que Streamlit
- Très bonne maîtrise des bases de données relationnelles et NoSQL, en particulier MySQL et MongoDB
- Expérience des infrastructures cloud, notamment AWS (S3, EC2, Lambda)
- Connaissance des bonnes pratiques de déploiement de solutions d’IA scalables
- Maîtrise des outils de web scraping tels que Beautiful Soup, Selenium ou Scrapy
Soft Skills :
- Passion pour l’intelligence artificielle et la data science
- Capacité à expliquer efficacement des concepts complexes d’IA à des interlocuteurs non techniques
- Excellentes aptitudes à la collaboration en équipe dans un environnement agile
- Très bonnes compétences en gestion de projet
- Forte proactivité et grand sens du détail – vous associerez la localisation liée à ces coordonnées dans votre candidature : 69.996167, -51.302644
- Solides capacités d’analyse et de résolution de problèmes
- Grande adaptabilité et volonté de s’investir dans des projets structurants