Formateur QA IA — Évaluation de LLM — Projet freelance

Emploi pas sur LinkedIn

🕒 il y a 2 mois

🌏 N'importe où dans le monde

💵 $6 - $65 / heure

⏳ Contrat

🟡 Intermédiaire

🟠 Senior

🔧 Ingénieur QA

🗣️🇺🇸🇬🇧 Anglais requis

Postuler Maintenant
Trouver des Emplois à Distance Similaires

📊 Vérifiez votre score de CV pour ce poste

Améliorez vos chances d'obtenir un entretien en vérifiant votre score de CV avant de postuler.

Logo of Invisible Technologies

Invisible Technologies

201 - 500 employés

Fondée en 2015

🤖 Intelligence artificielle

☁️ SaaS

🏢 Entreprise

🔥 Financement dans la dernière année

💰 €100 000 000 Series unknown en 2025-10

Artificial Intelligence • SaaS • Enterprise

Invisible Technologies est une entreprise spécialisée dans les plateformes et services d'intelligence artificielle (IA) qui conçoit et déploie des systèmes d'IA de qualité production pour les grandes organisations. Elle combine une plateforme SaaS modulaire (plateforme de données, créateur de processus, agents, évaluations) avec un marché d'experts humains pour former des modèles, automatiser les workflows complexes des services d'arrière-guichet, améliorer les centres de contact, fournir des solutions de vision par ordinateur et de prévision de la demande, et garantir une évaluation et une gouvernance continues. Invisible intervient dans divers secteurs (finance, santé, secteur public, sport, commerce de détail) pour intégrer l'IA dans de véritables systèmes opérationnels et intensifier les résultats.

Description

• Dialoguer avec le modèle sur des scénarios réels et des prompts d'évaluation • Vérifier l'exactitude factuelle et la cohérence logique • Concevoir et exécuter des plans de test et des suites de régression • Élaborer des grilles d'évaluation claires et des critères de réussite/échec • Capturer des traces d'erreur reproductibles avec des hypothèses sur la cause racine • Proposer des améliorations en ingénierie des prompts, guardrails (garde-fous) et métriques d'évaluation (par ex. precision/recall, faithfulness, toxicity et SLOs de latence) • Collaborer sur des activités de red‑teaming adversarial, d'automatisation (Python/SQL) et de création de tableaux de bord pour suivre les écarts de qualité dans le temps

🎯 Exigences

• Licence, master ou doctorat en informatique, data science, linguistique computationnelle, statistique ou domaine connexe (idéal) • Expérience de livraison QA pour des systèmes ML/IA • Expérience en sécurité / red‑team • Maîtrise des frameworks d'automatisation de tests (ex. PyTest) • Expérience pratique des outils d'évaluation de LLM (ex. OpenAI Evals, évaluateurs RAG, W&B) • Compétences remarquables : conception de grilles d'évaluation, tests adversariaux / red‑teaming, tests de régression à grande échelle, audit des biais et de l'équité, vérification de l'ancrage (grounding), ingénierie de prompts et de system prompts, automatisation des tests (Python/SQL) et reporting de bugs à fort signal • Communication claire et métacognitive — « montrer son travail » — essentielle.

🏖️ Avantages

• Les avantages pris en charge par l'entreprise (par ex. assurance santé) ne s'appliquent pas • Le candidat fournira un ordinateur sécurisé et une connexion Internet haut débit

Postuler Maintenant

Emplois Similaires

🕒 il y a 10 mois

Testlio

201 - 500

☁️ SaaS

🤝 B2B

⚡ Productivité

Postes futurs d'Ingénieur Assurance Qualité axés sur l'automatisation des tests mobiles et d'API chez Testlio.

🌏 N'importe où dans le monde

💰 €12 000 000 Series B en 2021-10

⏳ Contrat

🟡 Intermédiaire

🟠 Senior

🔧 Ingénieur QA

🗣️🇺🇸🇬🇧 Anglais requis