Métier IA · PACA

Recruter un Machine Learning Engineer

Pas un Data Scientist 'qui sait coder un peu'. Pas un Data Engineer 'qui a vu PyTorch'. Un ingénieur qui prend un modèle ML, le met en production, le monitore, le réentraîne, et le maintient sur la durée.

Confier un recrutement IA Diagnostic gratuit en 15 min

Notre terrainMLflowPyTorchSageMakerFeature StoreMonitoring

Tous les métiers IA

Le métier — sans bullshit

Un ML Engineer, c'est quoi vraiment en 2026 ?

Le ML Engineer transforme un modèle qui marche sur un notebook Jupyter en un système qui sert des prédictions à l'échelle, de façon fiable, monitorée et maintenable.

Concrètement, sur une journée type : il itère sur du feature engineering, lance des runs MLflow ou Weights & Biases, package un modèle dans un container, l'expose via une API, met en place du monitoring de drift et de performance, et débugge le pipeline de training/inference quand quelque chose part en cacahuète.

Différence avec l'AI Engineer : l'AI Engineer est LLM-first (RAG, agents, prompt engineering). Le ML Engineer couvre un spectre plus large : forecasting, scoring, recsys, computer vision, NLP classique, et oui aussi LLM quand le cas d'usage le justifie. Les deux profils se croisent souvent, mais les stacks et les réflexes diffèrent.

Comparaison rôles

ML Engineer vs AI Engineer vs Data Scientist vs MLOps.

Ces 4 rôles se chevauchent. Mais en 2026, dans une équipe IA mature, on les distingue clairement. Voici comment on les qualifie sur le terrain.

Critère	ML Engineer	AI Engineer	Data Scientist	MLOps
Focus stack	PyTorch, scikit-learn, XGBoost, MLflow	LangChain, LangGraph, vector DB, LLM APIs	Pandas, scikit-learn, statsmodels, notebooks	Kubernetes, Docker, Terraform, CI/CD ML
Objectif principal	Industrialiser des modèles ML en production	Builder des produits IA LLM (RAG, agents)	Analyser, modéliser, prototyper	Infra & ops des plateformes ML
Livre des notebooks	Non — code de production, API, services	Non — apps, agents, intégrations	Oui — analyses, POC, dashboards	Non — pipelines, infra-as-code
Connaît Kubernetes	Oui (basique à avancé)	Oui (basique)	Rarement	Oui (avancé, c'est son métier)
Salaire médian PACA	55-78 k€ confirmé	55-75 k€ confirmé	48-65 k€ confirmé	55-78 k€ confirmé

Stack technique 2026

Les outils que votre ML Engineer doit maîtriser.

Frameworks ML

scikit-learnPyTorchTensorFlow / KerasXGBoost / LightGBMHugging Face Transformers

Tracking & Versioning

MLflowWeights & BiasesDVCGit LFS

Plateformes Cloud ML

AWS SageMakerGCP Vertex AIAzure MLDatabricks ML

Orchestration & Pipelines

AirflowKubeflow PipelinesPrefectDagsterMetaflow

Feature Store & Monitoring

FeastTectonEvidentlyArizeWhyLabsPrometheus + Grafana

Infra & Déploiement

DockerKubernetesTriton Inference ServerBentoMLRay Serve

Salaires ML Engineer en PACA — mars 2026

42-100k€, +5 à +10% sur Sophia, premium MLOps sur profils GPU.

Le marché ML Engineer est moins tendu que l'AI Engineer pur LLM-first, mais les profils avec expérience MLOps en production sont rares (et chers).

Ville	Junior	Confirmé	Senior	Expert / Lead
Marseille	42 – 50 k€	52 – 70 k€	72 – 95 k€	90 – 120 k€
Aix-en-Provence	40 – 48 k€	50 – 68 k€	70 – 92 k€	88 – 118 k€
Sophia Antipolis	45 – 55 k€	55 – 78 k€	78 – 105 k€	100 – 130 k€
Nice	42 – 50 k€	52 – 72 k€	72 – 98 k€	95 – 125 k€

Source : compilation Recruteurs.io · Glassdoor · Hellowork · Factoriel · observations terrain mars 2026.

Détecter les faux ML Engineers

5 questions techniques que nous posons en pré-qualification.

Ces questions ne demandent pas de coder. Elles révèlent en 10 minutes si le candidat a effectivement mis du ML en production ou s'il a juste fait des tutos Kaggle.

Décris ton dernier modèle mis en production. Comment il était déployé, et comment tu détectais qu'il dérivait ?

Bon signe

Cite un cas concret : modèle, dataset, infra (SageMaker / Vertex / K8s), monitoring (Evidently, Arize, drift de features, drift de prédictions, métriques business). Sait expliquer ce qui s'est cassé et comment ça a été corrigé.

Drapeau rouge

Reste vague, parle de 'on a déployé en prod' sans détailler comment, n'a jamais regardé son modèle vivre après le go-live, ne sait pas ce qu'est le data drift vs concept drift.

Comment tu gères la reproductibilité d'un entraînement entre dev et prod ?

Bon signe

Cite des outils concrets : MLflow / W&B pour le tracking, DVC pour les data, seeds fixés, container Docker reproductible, requirements pinned, hash des datasets. Sait expliquer les pièges (non-déterminisme GPU, version PyTorch / CUDA).

Drapeau rouge

'On utilise le même notebook' ou 'Git suffit'. Ne mentionne ni tracking, ni versioning de données, ni containerisation.

Tu as un dataset déséquilibré (1% positifs). Tu fais quoi avant même de regarder un modèle ?

Bon signe

Définit la métrique métier (precision/recall, F1, AUC-PR vs ROC, coût d'erreur asymétrique). Vérifie la qualité des labels, le leakage, la cohérence train/val/test. Mentionne stratified split, échantillonnage (SMOTE, undersampling) en option, mais surtout métriques calibrées.

Drapeau rouge

Saute direct sur 'on fait du SMOTE' ou 'on entraîne un XGBoost avec class_weight'. Ne parle pas de métrique business, n'évoque pas le leakage.

Quelle est la dernière fois où tu as réentraîné un modèle en prod ? Et comment ça s'est déclenché ?

Bon signe

Décrit un trigger concret : monitoring drift, baisse de métrique métier, cron périodique, nouveau batch de données labellisées. Cite le process : entraînement, validation A/B ou shadow, rollout progressif, rollback prévu.

Drapeau rouge

'On réentraîne quand on peut' ou 'jamais, ça marche bien'. N'a pas de stratégie de re-training. Pas de A/B testing.

On te demande de mettre un modèle XGBoost à 50ms de latence p99 sur 1000 req/s. Comment tu instrumentes ?

Bon signe

Pense capacity planning : taille du modèle, batching, vectorisation, ONNX / Treelite pour XGBoost, choix infra (CPU vs GPU selon modèle), autoscaling, monitoring p50/p95/p99. Cite Triton, BentoML, ou un wrapper FastAPI selon contexte.

Drapeau rouge

Répond 'on le met derrière une API FastAPI'. N'a pas de notion de p99, ne pense pas au batching, à la sérialisation, à l'autoscaling.

Salaires IA & ML PACA — tous métiers

Comparer avec les autres métiers IA en PACA.

Métier	Junior (0-2 ans)	Confirmé (3-7 ans)	Senior (8+ ans)	Expert / Lead	Note
AI Engineer	45 – 55 k€	55 – 75 k€	75 – 105 k€	100 – 140 k€	Demande forte en RAG/agents.
Machine Learning Engineer	42 – 52 k€	52 – 72 k€	72 – 100 k€	95 – 130 k€	Profil rare avec exp. prod MLOps.
MLOps Engineer	45 – 55 k€	55 – 78 k€	78 – 110 k€	—	Marché tendu, prime à l'infra GPU.
Data Scientist	38 – 48 k€	48 – 65 k€	65 – 90 k€	85 – 120 k€	Volume important, écart selon stack.
Data Engineer	40 – 50 k€	50 – 70 k€	70 – 95 k€	—	Indispensable pour alimenter les modèles.
AI Automation Specialist	38 – 48 k€	48 – 65 k€	65 – 85 k€	—	n8n / Make / Zapier + LLM, croissance forte.
Prompt Engineer	40 – 50 k€	50 – 68 k€	68 – 90 k€	—	Souvent confondu avec AI Engineer. À cadrer.
AI Product Manager	50 – 62 k€	62 – 85 k€	85 – 120 k€	—	Mix produit + tech, profils rares.
Architecte IA	—	70 – 95 k€	95 – 130 k€	125 – 160 k€	Sénior obligatoire, vision système.
Consultant IA	40 – 55 k€	55 – 80 k€	80 – 120 k€	—	Forte variance selon BU/cabinet.
Agentic AI Engineer	50 – 62 k€	62 – 90 k€	90 – 130 k€	—	Émergent. Premium parce que peu de profils.

Source : compilation Recruteurs.io · Hellowork · Glassdoor · Factoriel · JeDha · Indeed · observations terrain (mars 2026). Région PACA : ajustement -10 à -20% vs Paris, +5% sur Sophia Antipolis (tension forte).

Vous cherchez un ML Engineer en PACA ?

Notre cabinet a un pipeline actif sur ces profils. Brief 30 min, court-list 4-6 candidats qualifiés en 15-20 jours, focus production.

Réserver 30 min Recevoir le baromètre salaires