Retour au hub IA PACA
Vérité inconfortable · IA PACA

80% des "AI Engineers" PACA ne savent pas faire un RAG en production.

Enquête terrain sur 6 mois d'entretiens, plus de 80 candidats qualifiés "AI Engineer" sur Marseille, Sophia, Aix et Nice. Le constat est brutal — et c'est un problème pour vos recrutements.

Gérald Gaillard· Fondateur Recruteurs.io22 mai 202612 min de lecture

Le constat — sur 80+ candidats qualifiés, 16 savent faire

Sur les 6 derniers mois, dans le cadre de briefs clients sur des postes "AI Engineer" en Provence-Alpes-Côte d'Azur, nous avons rencontré ou qualifié plus de 80 profils qui se présentent comme AI Engineer sur LinkedIn et leurs CVs.

À une question simple — "Décris-moi un RAG que tu as mis en production. Comment tu l'évaluais ?" — environ 16 candidats sur 80 ont donné une réponse qui tenait debout. Soit 20%. Soit, en miroir : 80% des "AI Engineers" du marché PACA ne savent pas faire un RAG en production.

Ce chiffre n'est pas exact à 1% près. C'est un ordre de grandeur. Mais l'écart entre la promesse du titre et la réalité est tel qu'il mérite un article.

Pourquoi cet article ?

Pour les dirigeants qui s'apprêtent à recruter leur premier AI Engineer en PACA et qui pensent qu'il suffit de poster une annonce avec "LangChain / RAG" pour faire venir des bons profils. Spoiler : non.

Pourquoi le marché est saturé de faux profils

Le titre "AI Engineer" est devenu en 18 mois ce que "Data Scientist" était devenu en 2018 : un titre fourre-tout, sexy à mettre sur LinkedIn, qui ne garantit aucune compétence réelle.

Trois forces ont convergé pour créer cette inflation :

1. La vague des bootcamps et certificats de 8 semaines

Depuis l'explosion ChatGPT fin 2022, des dizaines de bootcamps "Become an AI Engineer in 8 weeks" ont saturé LinkedIn. Sur le fond, beaucoup donnent une base sympa (LangChain, un Pinecone, quelques prompts). Sur le format : 8 semaines ne suffisent à personne pour acquérir la maturité production. Pourtant ces candidats ressortent avec "AI Engineer" sur leur LinkedIn.

2. Le re-badging par opportunisme

Le second flux vient de profils existants — Data Scientists, Data Analysts, développeurs full-stack — qui ont fait un POC ChatGPT en interne et qui repositionnent leur LinkedIn en "AI Engineer | LLM | RAG | Agents | Prompt Engineering".

Ce n'est pas malhonnête en soi, beaucoup ont effectivement touché à des LLM. Mais entre "j'ai branché une API OpenAI sur un Streamlit en hackathon" et "j'ai mis un RAG fiable en prod avec évaluation, monitoring et cache sémantique", il y a deux ans d'expérience.

3. Les recruteurs qui ne savent pas qualifier

Le 3e moteur, le plus gênant : les cabinets RH qui font le relais sans pouvoir filtrer. Quand le recruteur n'a jamais vu passer un seul RAG en production, il ne peut pas distinguer le candidat qui dit "j'ai utilisé LangChain" du candidat qui dit "j'ai utilisé LangChain mais on l'a viré pour aller en LlamaIndex parce que notre chunking custom devenait intenable".

Le résultat : 8 candidats sur 10 transmis à votre DSI sont des faux positifs. Vous perdez 3 mois d'entretiens, vous laissez passer les vrais profils qui pendant ce temps signent ailleurs, et vous finissez frustré.

Qu'est-ce qu'un "vrai RAG en production" ?

Un RAG — Retrieval-Augmented Generation — c'est l'architecture dominante des produits IA d'entreprise depuis 2023 : on indexe des documents internes dans une base vectorielle, on récupère les passages pertinents pour une question, et on les passe à un LLM en contexte pour qu'il génère une réponse ancrée dans vos données.

Sur le papier, en 50 lignes de Python, on peut faire tourner un RAG. Sur Twitter, on en voit passer un par heure. En production réelle, dans une entreprise qui doit gérer des utilisateurs, des coûts, des SLA, des hallucinations, du versioning de prompts et des cas limites, c'est un système complexe qui demande au minimum :

  • Pipeline d'ingestion : chunking adapté au type de document (un chunking naïf casse 80% de la qualité), extraction métadonnées, déduplication, gestion des mises à jour incrémentales.
  • Stratégie de retrieval : hybride dense + sparse (BM25 + embeddings), reranker (Cohere, voyage, cross-encoders), filtres métadonnées, query transformation.
  • Évaluation : un dataset d'évaluation construit avec les experts métier, des métriques (recall@k, MRR, faithfulness, answer relevance), un harness type ragas, deepeval, ou équivalent maison.
  • Monitoring et observability : Langfuse, Phoenix, Helicone — tracking des prompts, latences, coûts par requête, suivi des hallucinations remontées par les users.
  • Sécurité & guardrails : protection contre les prompt injections, filtrage PII, contrôle d'accès aux documents indexés (un RAG sans ACL est une fuite de données qui s'ignore).
  • Coûts : caching sémantique, batching, routing intelligent entre modèles (Haiku/Sonnet, Mistral Small/Large, etc.), budget par utilisateur ou par tenant.

Maîtriser ces 6 dimensions, c'est ce qui sépare un AI Engineer qui peut vous livrer un produit IA qui dure d'un AI Engineer qui vous livre un POC qui plante au 1er client.

Les 5 questions qui démasquent en 15 minutes

Voici les 5 questions qu'on pose systématiquement en pré-qualification d'un AI Engineer. Aucune ne demande de coder. Toutes révèlent en quelques minutes si le candidat a vraiment shippé un RAG, ou s'il a vu passer un tuto.

1

Décris-moi le dernier RAG que tu as mis en production. Comment tu l'évaluais ?

Vrai AI Engineer

Cite un cas concret : type de documents, choix de chunking, modèle d'embedding, base vectorielle, reranker. Décrit le dataset d'évaluation construit avec les experts métier, les métriques (faithfulness, answer relevance, recall@k), le harness (ragas, deepeval, ou maison). Sait raconter ce qui ne marchait pas et comment il l'a corrigé.

Faux AI Engineer

'On a fait du LangChain avec Pinecone, ça marchait bien.' Pas de métrique, pas de dataset d'éval, pas de notion de faithfulness. A déployé un POC qu'il appelle prod.

2

Quelle est la pire hallucination que tu as eue en production, et qu'est-ce que tu as fait après ?

Vrai AI Engineer

Raconte un incident précis : tel utilisateur a reçu telle info inventée parce que tel passage du RAG était hors contexte / trop court / mal chunké. Décrit ce qu'il a mis en place après : meilleurs filtres metadata, reranker, prompt avec contraintes 'cite tes sources', alertes Langfuse, peut-être un refus de répondre si la confiance est faible.

Faux AI Engineer

'On n'a pas vraiment eu d'hallucination, le modèle est bien.' Réponse impossible si on tourne en prod plus de 6 mois. Signifie soit qu'il n'a pas tourné en prod, soit qu'il n'a aucun monitoring.

3

Combien coûte ton RAG par mois, et comment tu as réduit ce coût ?

Vrai AI Engineer

Donne un ordre de grandeur (X € / 1 000 requêtes), explique le routing entre modèles (Haiku/Sonnet, Mistral Small/Large), le cache sémantique (vector cache ou Redis hash), le batching, la troncature de contexte. Sait quel poste pèse le plus (embeddings vs génération vs reranker).

Faux AI Engineer

'On utilise GPT-4o pour tout, c'est fiable.' Pas de notion coût/perf, pas de routing, pas de cache, brûle du budget cloud sans mesurer.

4

Comment tu gères la mise à jour de tes documents indexés ?

Vrai AI Engineer

Décrit le pipeline d'ingestion incrémentale (CDC, batch nocturne, webhook), gestion des suppressions et des updates (overwrite vs append vs versioning), invalidation cache, recalcul des embeddings sur changement de modèle. Pense aux ACL : un doc retiré du système source doit être retiré du RAG.

Faux AI Engineer

'On réindexe tout chaque semaine.' Cher, lent, casse les performances. Ne pense pas aux ACL — un RAG sans contrôle d'accès est un risque RGPD direct.

5

Tu dois choisir entre LangChain, LlamaIndex, Haystack ou tout en maison. Tu choisis quoi pour un client B2B avec 1 M documents et SLA strict ?

Vrai AI Engineer

Réponse nuancée : ça dépend de la maturité de l'équipe, des contraintes (multi-tenant, traçabilité), du scope (RAG simple vs agents complexes). Parle d'éviter le lock-in framework, de garder la couche retrieval découplée du framework agent, de la possibilité d'utiliser plusieurs briques. Cite ses retours d'expérience.

Faux AI Engineer

'LangChain c'est le standard.' Ou 'On fait tout en maison parce que c'est mieux.' Réponse dogmatique. Pas de réflexion sur le contexte, la dette technique, l'équipe.

Ce que coûte un mauvais recrutement AI Engineer

Un AI Engineer mal recruté en PACA, c'est en moyenne :

  • 3 à 6 mois de salaire chargé (40-70 k€) sur un profil qui ne livrera pas le produit annoncé.
  • 2 à 4 mois de bandwidth dirigeant à débugger, recadrer, parfois licencier — temps qui aurait dû aller sur la stratégie produit.
  • 6 à 12 mois de retard sur la roadmap IA, parce que le POC livré ne passe pas en prod et qu'il faut tout reprendre avec un autre profil.
  • Coût d'opportunité : les vrais AI Engineers que vous avez croisés au début ont signé ailleurs, et il faut maintenant chasser ceux qui restent — souvent plus chers, parce qu'ils savent que vous êtes désespéré.

Total : un mauvais recrutement AI Engineer coûte facilement 80 à 150 k€ à votre boîte, sans compter le moral des équipes. À ce prix, prendre 3 semaines de plus pour qualifier 5 profils est de loin la meilleure décision.

Le marché PACA en particulier

Trois éléments rendent le marché PACA spécifique pour les AI Engineers :

D'abord, l'offre est limitée mais en croissance. Nous estimons entre 200 et 350 vrais AI Engineers (au sens "shippé un produit LLM en prod sur au moins 2 ans") sur la région entre Marseille, Aix, Sophia et Nice. C'est peu. Et la moitié est en CDI dans des corporates qui paient bien (Amadeus, Mistral via partenariats, scale-ups locales).

Ensuite, la concurrence parisienne en remote est brutale. Les boîtes parisiennes proposent des packages 80-130 k€ en télétravail intégral. Si vous proposez 60 k€ en présentiel à Marseille, vous ne capterez que les candidats qui ont une raison personnelle de rester (famille, cadre de vie). Ce n'est pas mauvais en soi, mais il faut calibrer ses attentes.

Enfin, l'écosystème local pousse l'offre. Le partenariat CMA CGM × Mistral AI annoncé fin 2024 (100 M€, hub IA basé à Marseille), l'inauguration du Pôle Alpha à Sophia en janvier 2026, la dynamique 3IA Côte d'Azur et la House of AI : la demande explose, l'offre suit avec un décalage. C'est exactement la situation dans laquelle on recrute mal si on ne sait pas qualifier.

Conclusion — ce qu'on recommande

Si vous recrutez votre premier AI Engineer en PACA en 2026 :

  1. Ne vous fiez pas au titre LinkedIn. Le titre "AI Engineer" couvre aujourd'hui des écarts de compétence de 1 à 10.
  2. Posez les 5 questions ci-dessus. Elles font le tri en 15 minutes. Si vos questions actuelles ressemblent à "tu connais LangChain ?", vous êtes par définition incapable de qualifier.
  3. Faites un test technique court mais réaliste. Pas un leetcode. Un mini-RAG sur un PDF métier + un paragraphe d'évaluation. 4h maximum. Ça révèle plus que 10 entretiens.
  4. Calibrez le package au marché réel. 45-55 k€ junior, 55-75 k€ confirmé, 75-105 k€ senior, 100-140 k€ expert. Plus bas, vous ne captez que les faux positifs.
  5. Préparez votre offre. Stack tech à jour (pas du Python 3.6 ni du Tensorflow 1), accès GPU ou crédits cloud, autonomie sur les choix de modèles, vision produit claire. Les vrais AI Engineers en PACA ont l'embarras du choix, ils choisissent le projet en premier, le salaire en second.

Et si vous voulez déléguer cette qualification à un cabinet qui maîtrise le sujet — c'est exactement ce qu'on fait. Notre process commence par un brief stratégique de 30 minutes pour comprendre votre vrai besoin, et finit par une court-list de 5 profils qui passent nos 5 questions.

Gérald Gaillard, fondateur de Recruteurs.io. Cabinet de recrutement IA spécialisé PACA. Vous pouvez me joindre via LinkedIn ou réserver un créneau directement sur la page Réservation.

Vous voulez recruter un vrai AI Engineer en PACA ?

Brief 30 minutes pour qualifier votre besoin, court-list de 5 candidats qui passent nos 5 questions. Garantie de remplacement sur 6 mois.