Recruter un Prompt Engineer
Le métier le plus survendu de 2024. En 2026, il existe vraiment — mais il ne consiste pas à écrire des prompts dans un Notion. Un vrai Prompt Engineer construit un système de prompts versionnés, testé, monitoré, optimisé.
Prompt Engineer : un vrai métier en 2026, à condition de bien le cadrer.
Un Prompt Engineer ne se résume pas à "savoir bien parler à ChatGPT". Sur un système LLM en production, le prompt fait partie du code applicatif critique. Le faire évoluer sans casser les sorties demande une discipline : versioning, tests automatisés, métriques d'éval, A/B testing.
Un Prompt Engineer mature passe ses journées à : itérer sur un prompt en local, lancer un eval framework (promptfoo, ragas, deepeval), comparer 2 versions sur un dataset de référence, monitorer LangFuse ou Helicone pour repérer les régressions, et collaborer avec les AI Engineers pour structurer les sorties (function calling, JSON schema, guardrails).
Le piège du marché : 70% des candidats qui se disent Prompt Engineer sont en réalité des utilisateurs avancés de ChatGPT. Ils savent obtenir une bonne réponse en chat, mais ils ne savent pas industrialiser un prompt en prod. Notre job : faire la différence dès le brief.
Les outils que votre Prompt Engineer doit maîtriser.
LLM APIs
Prompt versioning
Eval frameworks
Guardrails & structure
A/B testing & rollout
Outils pratiques
40-90 k€, salaire fortement lié au niveau de discipline industrielle.
| Ville | Junior | Confirmé | Senior | Expert / Lead |
|---|---|---|---|---|
| Marseille | 40 – 50 k€ | 50 – 65 k€ | 65 – 85 k€ | 80 – 90 k€ |
| Aix-en-Provence | 38 – 48 k€ | 48 – 62 k€ | 62 – 82 k€ | 78 – 88 k€ |
| Sophia Antipolis | 42 – 52 k€ | 52 – 68 k€ | 68 – 88 k€ | 85 – 95 k€ |
| Nice | 40 – 50 k€ | 50 – 65 k€ | 65 – 85 k€ | 80 – 90 k€ |
5 questions pour distinguer un vrai Prompt Engineer.
Ces questions séparent en 10 minutes un Prompt Engineer industriel d'un utilisateur avancé de ChatGPT.
Décris ton process pour itérer sur un prompt en production.
Cite : un dataset d'évaluation construit avec les experts métier, un eval framework (promptfoo / ragas / deepeval), prompt versionné en git ou LangFuse, A/B testing entre versions, métriques business (pas juste 'ça a l'air mieux'), rollout progressif.
'Je modifie le prompt et je teste avec quelques exemples.' Pas de dataset, pas de versioning, pas d'A/B. Approche bricolage.
Tu as un prompt qui marche dans 95% des cas mais qui plante dans 5%. Comment tu débugges ?
Analyse les 5% : sont-ce des inputs adversariaux, des cas limites métier, des ambiguïtés ? Ajoute des few-shot examples ciblés, structure la sortie (JSON schema + retry), ajoute une étape de validation post-LLM, ou route vers un modèle plus puissant sur ces cas. Mesure que le fix ne dégrade pas les 95% qui marchaient.
'J'ajoute une instruction dans le prompt pour mieux gérer ces cas.' Sans mesurer la régression sur le reste, ça peut casser plus que ça répare.
Pourquoi utiliserais-tu function calling / structured output plutôt que parser un texte libre ?
Fiabilité : la sortie respecte un schéma, parsing déterministe, validation immédiate, possibilité de typer côté code. Économies (moins de tokens en sortie). Permet de chainer avec d'autres systèmes. Connaît Pydantic, JSON schema, et les limites (function calling peut être moins créatif que texte libre).
'C'est pareil, on peut parser le texte.' Ignore les pannes de format, les hallucinations de structure, les coûts.
Comment tu gères les hallucinations dans un système qui doit citer des sources internes ?
Combine plusieurs leviers : RAG correctement architecturé en amont (chunking + reranker), prompt système strict 'cite tes sources, refuse si non trouvé', éval de faithfulness sur dataset, guardrails post-LLM pour vérifier que les citations existent réellement dans le contexte. Pas de silver bullet.
'Je mets dans le prompt : ne hallucine pas.' Approche naïve, prouvée inefficace en prod.
Tu as 3 modèles à choisir : GPT-4o, Claude Sonnet, Mistral Large. Comment tu décides pour un cas d'usage donné ?
Réponse contextuelle : benchmarke sur un dataset propre au cas d'usage, compare qualité + latence + coût + structured output + capacité multilingue selon besoin. Tient compte de la souveraineté (Mistral pour clients sensibles). Sait que le 'meilleur modèle' dépend du cas.
'GPT-4o c'est le meilleur.' Réponse dogmatique. Pas de notion benchmark, pas de notion coût, pas de pratique terrain.
Tableau global des salaires IA en PACA.
| Métier | Junior (0-2 ans) | Confirmé (3-7 ans) | Senior (8+ ans) | Expert / Lead | Note |
|---|---|---|---|---|---|
| AI Engineer | 45 – 55 k€ | 55 – 75 k€ | 75 – 105 k€ | 100 – 140 k€ | Demande forte en RAG/agents. |
| Machine Learning Engineer | 42 – 52 k€ | 52 – 72 k€ | 72 – 100 k€ | 95 – 130 k€ | Profil rare avec exp. prod MLOps. |
| MLOps Engineer | 45 – 55 k€ | 55 – 78 k€ | 78 – 110 k€ | — | Marché tendu, prime à l'infra GPU. |
| Data Scientist | 38 – 48 k€ | 48 – 65 k€ | 65 – 90 k€ | 85 – 120 k€ | Volume important, écart selon stack. |
| Data Engineer | 40 – 50 k€ | 50 – 70 k€ | 70 – 95 k€ | — | Indispensable pour alimenter les modèles. |
| AI Automation Specialist | 38 – 48 k€ | 48 – 65 k€ | 65 – 85 k€ | — | n8n / Make / Zapier + LLM, croissance forte. |
| Prompt Engineer | 40 – 50 k€ | 50 – 68 k€ | 68 – 90 k€ | — | Souvent confondu avec AI Engineer. À cadrer. |
| AI Product Manager | 50 – 62 k€ | 62 – 85 k€ | 85 – 120 k€ | — | Mix produit + tech, profils rares. |
| Architecte IA | — | 70 – 95 k€ | 95 – 130 k€ | 125 – 160 k€ | Sénior obligatoire, vision système. |
| Consultant IA | 40 – 55 k€ | 55 – 80 k€ | 80 – 120 k€ | — | Forte variance selon BU/cabinet. |
| Agentic AI Engineer | 50 – 62 k€ | 62 – 90 k€ | 90 – 130 k€ | — | Émergent. Premium parce que peu de profils. |
Vous cherchez un Prompt Engineer en PACA ?
Profil souvent confondu avec un utilisateur de ChatGPT. Notre court-list filtre sur la pratique industrielle. 4-6 candidats qualifiés en 15-20 jours.
