Recruter un Machine Learning Engineer
Pas un Data Scientist 'qui sait coder un peu'. Pas un Data Engineer 'qui a vu PyTorch'. Un ingénieur qui prend un modèle ML, le met en production, le monitore, le réentraîne, et le maintient sur la durée.
Un ML Engineer, c'est quoi vraiment en 2026 ?
Le ML Engineer transforme un modèle qui marche sur un notebook Jupyter en un système qui sert des prédictions à l'échelle, de façon fiable, monitorée et maintenable.
Concrètement, sur une journée type : il itère sur du feature engineering, lance des runs MLflow ou Weights & Biases, package un modèle dans un container, l'expose via une API, met en place du monitoring de drift et de performance, et débugge le pipeline de training/inference quand quelque chose part en cacahuète.
Différence avec l'AI Engineer : l'AI Engineer est LLM-first (RAG, agents, prompt engineering). Le ML Engineer couvre un spectre plus large : forecasting, scoring, recsys, computer vision, NLP classique, et oui aussi LLM quand le cas d'usage le justifie. Les deux profils se croisent souvent, mais les stacks et les réflexes diffèrent.
ML Engineer vs AI Engineer vs Data Scientist vs MLOps.
Ces 4 rôles se chevauchent. Mais en 2026, dans une équipe IA mature, on les distingue clairement. Voici comment on les qualifie sur le terrain.
| Critère | ML Engineer | AI Engineer | Data Scientist | MLOps |
|---|---|---|---|---|
| Focus stack | PyTorch, scikit-learn, XGBoost, MLflow | LangChain, LangGraph, vector DB, LLM APIs | Pandas, scikit-learn, statsmodels, notebooks | Kubernetes, Docker, Terraform, CI/CD ML |
| Objectif principal | Industrialiser des modèles ML en production | Builder des produits IA LLM (RAG, agents) | Analyser, modéliser, prototyper | Infra & ops des plateformes ML |
| Livre des notebooks | Non — code de production, API, services | Non — apps, agents, intégrations | Oui — analyses, POC, dashboards | Non — pipelines, infra-as-code |
| Connaît Kubernetes | Oui (basique à avancé) | Oui (basique) | Rarement | Oui (avancé, c'est son métier) |
| Salaire médian PACA | 55-78 k€ confirmé | 55-75 k€ confirmé | 48-65 k€ confirmé | 55-78 k€ confirmé |
Les outils que votre ML Engineer doit maîtriser.
Frameworks ML
Tracking & Versioning
Plateformes Cloud ML
Orchestration & Pipelines
Feature Store & Monitoring
Infra & Déploiement
42-100k€, +5 à +10% sur Sophia, premium MLOps sur profils GPU.
Le marché ML Engineer est moins tendu que l'AI Engineer pur LLM-first, mais les profils avec expérience MLOps en production sont rares (et chers).
| Ville | Junior | Confirmé | Senior | Expert / Lead |
|---|---|---|---|---|
| Marseille | 42 – 50 k€ | 52 – 70 k€ | 72 – 95 k€ | 90 – 120 k€ |
| Aix-en-Provence | 40 – 48 k€ | 50 – 68 k€ | 70 – 92 k€ | 88 – 118 k€ |
| Sophia Antipolis | 45 – 55 k€ | 55 – 78 k€ | 78 – 105 k€ | 100 – 130 k€ |
| Nice | 42 – 50 k€ | 52 – 72 k€ | 72 – 98 k€ | 95 – 125 k€ |
Source : compilation Recruteurs.io · Glassdoor · Hellowork · Factoriel · observations terrain mars 2026.
5 questions techniques que nous posons en pré-qualification.
Ces questions ne demandent pas de coder. Elles révèlent en 10 minutes si le candidat a effectivement mis du ML en production ou s'il a juste fait des tutos Kaggle.
Décris ton dernier modèle mis en production. Comment il était déployé, et comment tu détectais qu'il dérivait ?
Cite un cas concret : modèle, dataset, infra (SageMaker / Vertex / K8s), monitoring (Evidently, Arize, drift de features, drift de prédictions, métriques business). Sait expliquer ce qui s'est cassé et comment ça a été corrigé.
Reste vague, parle de 'on a déployé en prod' sans détailler comment, n'a jamais regardé son modèle vivre après le go-live, ne sait pas ce qu'est le data drift vs concept drift.
Comment tu gères la reproductibilité d'un entraînement entre dev et prod ?
Cite des outils concrets : MLflow / W&B pour le tracking, DVC pour les data, seeds fixés, container Docker reproductible, requirements pinned, hash des datasets. Sait expliquer les pièges (non-déterminisme GPU, version PyTorch / CUDA).
'On utilise le même notebook' ou 'Git suffit'. Ne mentionne ni tracking, ni versioning de données, ni containerisation.
Tu as un dataset déséquilibré (1% positifs). Tu fais quoi avant même de regarder un modèle ?
Définit la métrique métier (precision/recall, F1, AUC-PR vs ROC, coût d'erreur asymétrique). Vérifie la qualité des labels, le leakage, la cohérence train/val/test. Mentionne stratified split, échantillonnage (SMOTE, undersampling) en option, mais surtout métriques calibrées.
Saute direct sur 'on fait du SMOTE' ou 'on entraîne un XGBoost avec class_weight'. Ne parle pas de métrique business, n'évoque pas le leakage.
Quelle est la dernière fois où tu as réentraîné un modèle en prod ? Et comment ça s'est déclenché ?
Décrit un trigger concret : monitoring drift, baisse de métrique métier, cron périodique, nouveau batch de données labellisées. Cite le process : entraînement, validation A/B ou shadow, rollout progressif, rollback prévu.
'On réentraîne quand on peut' ou 'jamais, ça marche bien'. N'a pas de stratégie de re-training. Pas de A/B testing.
On te demande de mettre un modèle XGBoost à 50ms de latence p99 sur 1000 req/s. Comment tu instrumentes ?
Pense capacity planning : taille du modèle, batching, vectorisation, ONNX / Treelite pour XGBoost, choix infra (CPU vs GPU selon modèle), autoscaling, monitoring p50/p95/p99. Cite Triton, BentoML, ou un wrapper FastAPI selon contexte.
Répond 'on le met derrière une API FastAPI'. N'a pas de notion de p99, ne pense pas au batching, à la sérialisation, à l'autoscaling.
Comparer avec les autres métiers IA en PACA.
| Métier | Junior (0-2 ans) | Confirmé (3-7 ans) | Senior (8+ ans) | Expert / Lead | Note |
|---|---|---|---|---|---|
| AI Engineer | 45 – 55 k€ | 55 – 75 k€ | 75 – 105 k€ | 100 – 140 k€ | Demande forte en RAG/agents. |
| Machine Learning Engineer | 42 – 52 k€ | 52 – 72 k€ | 72 – 100 k€ | 95 – 130 k€ | Profil rare avec exp. prod MLOps. |
| MLOps Engineer | 45 – 55 k€ | 55 – 78 k€ | 78 – 110 k€ | — | Marché tendu, prime à l'infra GPU. |
| Data Scientist | 38 – 48 k€ | 48 – 65 k€ | 65 – 90 k€ | 85 – 120 k€ | Volume important, écart selon stack. |
| Data Engineer | 40 – 50 k€ | 50 – 70 k€ | 70 – 95 k€ | — | Indispensable pour alimenter les modèles. |
| AI Automation Specialist | 38 – 48 k€ | 48 – 65 k€ | 65 – 85 k€ | — | n8n / Make / Zapier + LLM, croissance forte. |
| Prompt Engineer | 40 – 50 k€ | 50 – 68 k€ | 68 – 90 k€ | — | Souvent confondu avec AI Engineer. À cadrer. |
| AI Product Manager | 50 – 62 k€ | 62 – 85 k€ | 85 – 120 k€ | — | Mix produit + tech, profils rares. |
| Architecte IA | — | 70 – 95 k€ | 95 – 130 k€ | 125 – 160 k€ | Sénior obligatoire, vision système. |
| Consultant IA | 40 – 55 k€ | 55 – 80 k€ | 80 – 120 k€ | — | Forte variance selon BU/cabinet. |
| Agentic AI Engineer | 50 – 62 k€ | 62 – 90 k€ | 90 – 130 k€ | — | Émergent. Premium parce que peu de profils. |
Vous cherchez un ML Engineer en PACA ?
Notre cabinet a un pipeline actif sur ces profils. Brief 30 min, court-list 4-6 candidats qualifiés en 15-20 jours, focus production.
