LLM Evaluation Engineer

Emploi pas sur LinkedIn

🕒 il y a 2 mois

🇺🇸 États-Unis – Télétravail

⏰ Temps Plein

🟠 Senior

🔴 Expert

👷🏻‍♀️ Ingénieur

🗣️🇺🇸🇬🇧 Anglais requis

Python

PyTorch

Tensorflow

Postuler Maintenant
Trouver des Emplois à Distance Similaires

📊 Vérifiez votre score de CV pour ce poste

Améliorez vos chances d'obtenir un entretien en vérifiant votre score de CV avant de postuler.

Logo of ThirdLaw Molecular

ThirdLaw Molecular

1 - 10 employés

Fondée en 2020

🧬 Biotechnologie

💊 Pharmaceutique

⚕️ Assurance santé

Biotechnology • Pharmaceuticals • Healthcare Insurance

ThirdLaw Molecular est une entreprise de biotechnologie pionnière qui a développé une plateforme révolutionnaire utilisant les molécules Spiroligomer™ pour la découverte de médicaments ciblés et le diagnostic. Fondée par le Dr Christian Schafmeister, l'entreprise se concentre sur la création d'une nouvelle classe de thérapeutiques plus sûres et plus efficaces, en employant une plateforme chimique unique pour la conception de molécules synthétiquement conçues. Leur approche innovante permet une liaison hautement sélective aux protéines, augmentant le potentiel pour des thérapies médicamenteuses et des applications diagnostiques.

Description

• Build the evaluation layer in the ThirdLaw platform for LLM prompts and responses • Design and tune guardrails, classifiers, and semantic judgment systems in real-time • Implement evaluation strategies with semantic similarity, foundation model scoring, and rule-based systems • Integrate model outputs with downstream enforcement actions (e.g. redaction, escalation, blocking) • Prototype, tune, and productize small language models for classification, labeling, or scoring • Collaborate with data infrastructure engineers to connect evaluation logic with ingestion and storage • Build tools to observe, debug, and improve evaluator performance across data distributions • Define abstractions for reusable evaluation components that can scale across use cases

🎯 Exigences

• 7+ years of experience in ML systems or AI engineering roles • At least 1–2 years working directly with LLMs, NLP pipelines, or semantic search • Deep understanding of foundation models (e.g. OpenAI, Claude, Mistral, Llama) and APIs • Hands-on experience with vector search (e.g. FAISS, Qdrant, Weaviate) and embeddings pipelines • Proven ability to implement real-time or near-real-time evaluation logic using semantic similarity, classifier scoring, or structured rules • Strong in Python, with familiarity using libraries like Hugging Face Transformers, LangChain, and PyTorch or TensorFlow • Ability to reason about model behavior, test prompt configurations, and debug complex decision logic in production

🏖️ Avantages

• Generous benefits • Market cash compensation • Above-market equity • Well-designed benefits

Postuler Maintenant

Emplois Similaires

🕒 il y a 2 mois

Pearce Services

1001 - 5000

📡 Télécommunications

⚡ Énergie

🤝 B2B

Critical Power Field Technician maintaining UPS systems in Mobile, AL. Supporting clients with on-site preventive and corrective maintenance duties.

🇺🇸 États-Unis – Télétravail

💵 $35 000 - $45 000 / an

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

👷🏻‍♀️ Ingénieur

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Domo

501 - 1000

☁️ SaaS

🤖 Intelligence artificielle

🏢 Entreprise

Forward Deployed Engineer designing and deploying applications on Domo's AI platform. Collaborating with customers to replace traditional SaaS with custom real-time solutions.

🇺🇸 États-Unis – Télétravail

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

👷🏻‍♀️ Ingénieur

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Core Scientific

201 - 500

₿ Crypto

⚡ Énergie

Senior Controls Engineer responsible for designing control systems for data centers and industrial projects. Leading project management and integration for complex systems.

🇺🇸 États-Unis – Télétravail

⏰ Temps Plein

🟠 Senior

👷🏻‍♀️ Ingénieur

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

RaceOn

11 - 50

Vehicle Modelling & Simulation Engineer developing vehicle physics models and collaborating cross-functionally for race engineering. Focused on enhancing simulation tools' accuracy and efficiency.

🇺🇸 États-Unis – Télétravail

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

👷🏻‍♀️ Ingénieur

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Railway

11 - 50

☁️ SaaS

Infrastructure Engineer at Railway building global datacenters with a focus on performance and reliability. Role emphasizes technical challenges and creative solutions in a high ownership environment.

🇺🇸 États-Unis – Télétravail

💰 €20 000 000 Series A en 2022-05

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

👷🏻‍♀️ Ingénieur

🦅 Parrain de Visa H1B

info

🗣️🇺🇸🇬🇧 Anglais requis