Technical Staff Member, Model Efficiency

🕒 Março 18

🗽 New York – Remoto

info

⏰ Tempo Integral

🔴 Especialista

🖥 Engenheiro de Software

🦅 Patrocina Visto H1B

info

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Cohere

Cohere

11 - 50 funcionários

🤖 Inteligência Artificial

🏢 Corporativo

☁️ SaaS

Artificial Intelligence • Enterprise • SaaS

A Cohere é uma plataforma de IA líder, fornecendo às empresas modelos de linguagem avançada e um espaço de trabalho integrado projetado para eficiência e segurança. Com uma família de modelos generativos e de recuperação de alto desempenho, a Cohere permite que as organizações simplifiquem fluxos de trabalho, melhorem a segurança dos dados e descubram insights em diversas indústrias por meio de capacidades multilingues. Seu foco em soluções de IA personalizadas garante a proteção de dados críticos, facilitando a integração perfeita nos processos organizacionais existentes.

Descrição

• Work across the inference stack to improve core performance metrics • Dive deep into model execution • Identify bottlenecks and develop innovative optimizations • Collaborate closely with modeling and systems teams • Experiment, measure, and ship improvements that accelerate inference • Build expertise in advanced performance techniques, including GPU/CUDA optimizations, kernel-level improvements, and model execution strategies for MoE and large-scale architectures

🎯 Requisitos

• 5+ years of experience writing high-performance, production-quality code • Strong programming skills in C++ or Python (Rust/Go also welcome) • Experience working with large language models and familiarity with the LLM inference ecosystem (e.g., vLLM, SGLang, etc.) • Ability to diagnose and resolve performance bottlenecks across the model execution stack • A strong bias for action — you ship fast, measure impact, and iterate • It’s a big plus if you have experience with GPU programming, CUDA, or low-level systems optimization • Language modeling with transformers (MoE, speculative decoding, KV-cache optimizations) • Scaling performance-critical distributed systems (e.g., computation, search, storage)

🏖️ Benefícios

• An open and inclusive culture and work environment • Work closely with a team on the cutting edge of AI research • Weekly lunch stipend, in-office lunches & snacks • Full health and dental benefits, including a separate budget to take care of your mental health • 100% Parental Leave top-up for up to 6 months • Personal enrichment benefits towards arts and culture, fitness and well-being, quality time, and workspace improvement • Remote-flexible, offices in Toronto, New York, San Francisco, London and Paris, as well as a co-working stipend • 6 weeks of vacation (30 working days!)

Candidatar-se

Vagas Similares

🕒 Março 18

Andreessen Horowitz

201 - 500

💸 Finanças

💳 Fintech

🏢 Corporativo

Full-stack scientist pioneering quantitative research efforts at Udio. Building at the intersection of research, engineering, and product with proprietary datasets.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $250.000 - $350.000 / ano

⏰ Tempo Integral

🔴 Especialista

🖥 Engenheiro de Software

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Março 18

Reka AI

1 - 10

🤖 Inteligência Artificial

🏢 Corporativo

☁️ SaaS

Member of Technical Staff (ML) developing and evaluating deep learning models for Reka's AI applications. Collaborating with a global team to translate research into practical solutions.

🇺🇸 Estados Unidos – Remoto (EUA)

💰 $58.000.000 Series A em 2023-06

⏰ Tempo Integral

🔴 Especialista

🖥 Engenheiro de Software

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Março 18

Anchorage Digital

201 - 500

💸 Finanças

₿ Cripto

☁️ SaaS

Member of Technical Staff building robust streaming data infrastructure for Anchorage Digital's crypto platform. Collaborating with cross-functional teams to optimize and maintain high-quality data outputs.

🇺🇸 Estados Unidos – Remoto (EUA)

💰 $350.000.000 Series D em 2021-12

⏰ Tempo Integral

🔴 Especialista

🖥 Engenheiro de Software

🦅 Patrocina Visto H1B

info

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Março 18

Vytwo Technologies Inc

201 - 500

🤝 B2B

🏢 Corporativo

🎯 Recrutamento

SAP ABAP Developer with over 12 years of experience in SAP ECC & S/4 HANA development. Requires strong knowledge in ABAP, REST APIs, and system integration.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $55 - $60 / hora

⏰ Tempo Integral

🟠 Sênior

🔴 Especialista

🖥 Engenheiro de Software

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Março 12

Intus Care

11 - 50

⚕️ Seguro de Saúde

☁️ SaaS

🤖 Inteligência Artificial

Director of Engineering at Intus Care overseeing engineering teams for SaaS product development. Leading multiple engineering pods to build scalable healthcare technology solutions.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $170.000 - $190.000 / ano

💰 $13.100.000 Venture Round em 2023-01

⏰ Tempo Integral

🔴 Especialista

🖥 Engenheiro de Software

🦅 Patrocina Visto H1B

info

🗣️🇺🇸🇬🇧 Inglês obrigatório