Métier IA · PACA

Recruter un Machine Learning Engineer

Pas un Data Scientist 'qui sait coder un peu'. Pas un Data Engineer 'qui a vu PyTorch'. Un ingénieur qui prend un modèle ML, le met en production, le monitore, le réentraîne, et le maintient sur la durée.

Notre terrainMLflowPyTorchSageMakerFeature StoreMonitoring
Le métier — sans bullshit

Un ML Engineer, c'est quoi vraiment en 2026 ?

Le ML Engineer transforme un modèle qui marche sur un notebook Jupyter en un système qui sert des prédictions à l'échelle, de façon fiable, monitorée et maintenable.

Concrètement, sur une journée type : il itère sur du feature engineering, lance des runs MLflow ou Weights & Biases, package un modèle dans un container, l'expose via une API, met en place du monitoring de drift et de performance, et débugge le pipeline de training/inference quand quelque chose part en cacahuète.

Différence avec l'AI Engineer : l'AI Engineer est LLM-first (RAG, agents, prompt engineering). Le ML Engineer couvre un spectre plus large : forecasting, scoring, recsys, computer vision, NLP classique, et oui aussi LLM quand le cas d'usage le justifie. Les deux profils se croisent souvent, mais les stacks et les réflexes diffèrent.

Comparaison rôles

ML Engineer vs AI Engineer vs Data Scientist vs MLOps.

Ces 4 rôles se chevauchent. Mais en 2026, dans une équipe IA mature, on les distingue clairement. Voici comment on les qualifie sur le terrain.

CritèreML EngineerAI EngineerData ScientistMLOps
Focus stackPyTorch, scikit-learn, XGBoost, MLflowLangChain, LangGraph, vector DB, LLM APIsPandas, scikit-learn, statsmodels, notebooksKubernetes, Docker, Terraform, CI/CD ML
Objectif principalIndustrialiser des modèles ML en productionBuilder des produits IA LLM (RAG, agents)Analyser, modéliser, prototyperInfra & ops des plateformes ML
Livre des notebooksNon — code de production, API, servicesNon — apps, agents, intégrationsOui — analyses, POC, dashboardsNon — pipelines, infra-as-code
Connaît KubernetesOui (basique à avancé)Oui (basique)RarementOui (avancé, c'est son métier)
Salaire médian PACA55-78 k€ confirmé55-75 k€ confirmé48-65 k€ confirmé55-78 k€ confirmé
Stack technique 2026

Les outils que votre ML Engineer doit maîtriser.

Frameworks ML

scikit-learnPyTorchTensorFlow / KerasXGBoost / LightGBMHugging Face Transformers

Tracking & Versioning

MLflowWeights & BiasesDVCGit LFS

Plateformes Cloud ML

AWS SageMakerGCP Vertex AIAzure MLDatabricks ML

Orchestration & Pipelines

AirflowKubeflow PipelinesPrefectDagsterMetaflow

Feature Store & Monitoring

FeastTectonEvidentlyArizeWhyLabsPrometheus + Grafana

Infra & Déploiement

DockerKubernetesTriton Inference ServerBentoMLRay Serve
Salaires ML Engineer en PACA — mars 2026

42-100k€, +5 à +10% sur Sophia, premium MLOps sur profils GPU.

Le marché ML Engineer est moins tendu que l'AI Engineer pur LLM-first, mais les profils avec expérience MLOps en production sont rares (et chers).

VilleJuniorConfirméSeniorExpert / Lead
Marseille42 – 50 k€52 – 70 k€72 – 95 k€90 – 120 k€
Aix-en-Provence40 – 48 k€50 – 68 k€70 – 92 k€88 – 118 k€
Sophia Antipolis45 – 55 k€55 – 78 k€78 – 105 k€100 – 130 k€
Nice42 – 50 k€52 – 72 k€72 – 98 k€95 – 125 k€

Source : compilation Recruteurs.io · Glassdoor · Hellowork · Factoriel · observations terrain mars 2026.

Détecter les faux ML Engineers

5 questions techniques que nous posons en pré-qualification.

Ces questions ne demandent pas de coder. Elles révèlent en 10 minutes si le candidat a effectivement mis du ML en production ou s'il a juste fait des tutos Kaggle.

1

Décris ton dernier modèle mis en production. Comment il était déployé, et comment tu détectais qu'il dérivait ?

Bon signe

Cite un cas concret : modèle, dataset, infra (SageMaker / Vertex / K8s), monitoring (Evidently, Arize, drift de features, drift de prédictions, métriques business). Sait expliquer ce qui s'est cassé et comment ça a été corrigé.

Drapeau rouge

Reste vague, parle de 'on a déployé en prod' sans détailler comment, n'a jamais regardé son modèle vivre après le go-live, ne sait pas ce qu'est le data drift vs concept drift.

2

Comment tu gères la reproductibilité d'un entraînement entre dev et prod ?

Bon signe

Cite des outils concrets : MLflow / W&B pour le tracking, DVC pour les data, seeds fixés, container Docker reproductible, requirements pinned, hash des datasets. Sait expliquer les pièges (non-déterminisme GPU, version PyTorch / CUDA).

Drapeau rouge

'On utilise le même notebook' ou 'Git suffit'. Ne mentionne ni tracking, ni versioning de données, ni containerisation.

3

Tu as un dataset déséquilibré (1% positifs). Tu fais quoi avant même de regarder un modèle ?

Bon signe

Définit la métrique métier (precision/recall, F1, AUC-PR vs ROC, coût d'erreur asymétrique). Vérifie la qualité des labels, le leakage, la cohérence train/val/test. Mentionne stratified split, échantillonnage (SMOTE, undersampling) en option, mais surtout métriques calibrées.

Drapeau rouge

Saute direct sur 'on fait du SMOTE' ou 'on entraîne un XGBoost avec class_weight'. Ne parle pas de métrique business, n'évoque pas le leakage.

4

Quelle est la dernière fois où tu as réentraîné un modèle en prod ? Et comment ça s'est déclenché ?

Bon signe

Décrit un trigger concret : monitoring drift, baisse de métrique métier, cron périodique, nouveau batch de données labellisées. Cite le process : entraînement, validation A/B ou shadow, rollout progressif, rollback prévu.

Drapeau rouge

'On réentraîne quand on peut' ou 'jamais, ça marche bien'. N'a pas de stratégie de re-training. Pas de A/B testing.

5

On te demande de mettre un modèle XGBoost à 50ms de latence p99 sur 1000 req/s. Comment tu instrumentes ?

Bon signe

Pense capacity planning : taille du modèle, batching, vectorisation, ONNX / Treelite pour XGBoost, choix infra (CPU vs GPU selon modèle), autoscaling, monitoring p50/p95/p99. Cite Triton, BentoML, ou un wrapper FastAPI selon contexte.

Drapeau rouge

Répond 'on le met derrière une API FastAPI'. N'a pas de notion de p99, ne pense pas au batching, à la sérialisation, à l'autoscaling.

Salaires IA & ML PACA — tous métiers

Comparer avec les autres métiers IA en PACA.

MétierJunior (0-2 ans)Confirmé (3-7 ans)Senior (8+ ans)Expert / LeadNote
AI Engineer45 – 55 k€55 – 75 k€75 – 105 k€100 – 140 k€Demande forte en RAG/agents.
Machine Learning Engineer42 – 52 k€52 – 72 k€72 – 100 k€95 – 130 k€Profil rare avec exp. prod MLOps.
MLOps Engineer45 – 55 k€55 – 78 k€78 – 110 k€Marché tendu, prime à l'infra GPU.
Data Scientist38 – 48 k€48 – 65 k€65 – 90 k€85 – 120 k€Volume important, écart selon stack.
Data Engineer40 – 50 k€50 – 70 k€70 – 95 k€Indispensable pour alimenter les modèles.
AI Automation Specialist38 – 48 k€48 – 65 k€65 – 85 k€n8n / Make / Zapier + LLM, croissance forte.
Prompt Engineer40 – 50 k€50 – 68 k€68 – 90 k€Souvent confondu avec AI Engineer. À cadrer.
AI Product Manager50 – 62 k€62 – 85 k€85 – 120 k€Mix produit + tech, profils rares.
Architecte IA70 – 95 k€95 – 130 k€125 – 160 k€Sénior obligatoire, vision système.
Consultant IA40 – 55 k€55 – 80 k€80 – 120 k€Forte variance selon BU/cabinet.
Agentic AI Engineer50 – 62 k€62 – 90 k€90 – 130 k€Émergent. Premium parce que peu de profils.
Source : compilation Recruteurs.io · Hellowork · Glassdoor · Factoriel · JeDha · Indeed · observations terrain (mars 2026). Région PACA : ajustement -10 à -20% vs Paris, +5% sur Sophia Antipolis (tension forte).

Vous cherchez un ML Engineer en PACA ?

Notre cabinet a un pipeline actif sur ces profils. Brief 30 min, court-list 4-6 candidats qualifiés en 15-20 jours, focus production.