Technical Staff Member, Model Efficiency

🕒 vor 3 Monaten

🗽 New York – Remote

info

⏰ Vollzeit

🔴 Experte

🖥 Softwareentwickler

🦅 H1B-Visum-Sponsor

info

🗣️🇺🇸🇬🇧 Englisch erforderlich

Jetzt Bewerben
Ähnliche Remote-Jobs finden

📊 Überprüfen Sie Ihre Lebenslauf-Bewertung für diese Stelle

Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

Logo of Cohere

Cohere

11 - 50 Mitarbeiter

🤖 Künstliche Intelligenz

🏢 Unternehmen

☁️ SaaS

Artificial Intelligence • Enterprise • SaaS

Cohere ist eine führende KI-Plattform, die Unternehmen fortschrittliche Sprachmodelle und einen integrierten Arbeitsbereich bietet, der auf Effizienz und Sicherheit ausgelegt ist. Mit einer Reihe von leistungsstarken generativen und Retrieval-Modellen ermöglicht Cohere Organisationen die Optimierung von Arbeitsabläufen, die Verbesserung der Datensicherheit und das Erschließen von Erkenntnissen über verschiedene Branchen hinweg durch mehrsprachige Fähigkeiten. Ihr Fokus auf maßgeschneiderte KI-Lösungen gewährleistet den Schutz kritischer Daten und erleichtert die nahtlose Integration in bestehende organisatorische Prozesse.

Beschreibung

• Work across the inference stack to improve core performance metrics • Dive deep into model execution • Identify bottlenecks and develop innovative optimizations • Collaborate closely with modeling and systems teams • Experiment, measure, and ship improvements that accelerate inference • Build expertise in advanced performance techniques, including GPU/CUDA optimizations, kernel-level improvements, and model execution strategies for MoE and large-scale architectures

🎯 Anforderungen

• 5+ years of experience writing high-performance, production-quality code • Strong programming skills in C++ or Python (Rust/Go also welcome) • Experience working with large language models and familiarity with the LLM inference ecosystem (e.g., vLLM, SGLang, etc.) • Ability to diagnose and resolve performance bottlenecks across the model execution stack • A strong bias for action — you ship fast, measure impact, and iterate • It’s a big plus if you have experience with GPU programming, CUDA, or low-level systems optimization • Language modeling with transformers (MoE, speculative decoding, KV-cache optimizations) • Scaling performance-critical distributed systems (e.g., computation, search, storage)

🏖️ Vorteile

• An open and inclusive culture and work environment • Work closely with a team on the cutting edge of AI research • Weekly lunch stipend, in-office lunches & snacks • Full health and dental benefits, including a separate budget to take care of your mental health • 100% Parental Leave top-up for up to 6 months • Personal enrichment benefits towards arts and culture, fitness and well-being, quality time, and workspace improvement • Remote-flexible, offices in Toronto, New York, San Francisco, London and Paris, as well as a co-working stipend • 6 weeks of vacation (30 working days!)

Jetzt Bewerben

Ähnliche Jobs

🕒 vor 3 Monaten

Andreessen Horowitz

201 - 500

💸 Finanzen

💳 Fintech

🏢 Unternehmen

Full-stack scientist pioneering quantitative research efforts at Udio. Building at the intersection of research, engineering, and product with proprietary datasets.

🇺🇸 Vereinigte Staaten – Remote

💵 $250.000 - $350.000 / Jahr

⏰ Vollzeit

🔴 Experte

🖥 Softwareentwickler

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 3 Monaten

Reka AI

1 - 10

🤖 Künstliche Intelligenz

🏢 Unternehmen

☁️ SaaS

Member of Technical Staff (ML) developing and evaluating deep learning models for Reka's AI applications. Collaborating with a global team to translate research into practical solutions.

🇺🇸 Vereinigte Staaten – Remote

💰 €58.000.000 Series A im 2023-06

⏰ Vollzeit

🔴 Experte

🖥 Softwareentwickler

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 3 Monaten

Anchorage Digital

201 - 500

💸 Finanzen

₿ Crypto

☁️ SaaS

Member of Technical Staff building robust streaming data infrastructure for Anchorage Digital's crypto platform. Collaborating with cross-functional teams to optimize and maintain high-quality data outputs.

🇺🇸 Vereinigte Staaten – Remote

💰 €350.000.000 Series D im 2021-12

⏰ Vollzeit

🔴 Experte

🖥 Softwareentwickler

🦅 H1B-Visum-Sponsor

info

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 3 Monaten

Vytwo Technologies Inc

201 - 500

🤝 B2B

🏢 Unternehmen

🎯 Rekrutierung

SAP ABAP Developer with over 12 years of experience in SAP ECC & S/4 HANA development. Requires strong knowledge in ABAP, REST APIs, and system integration.

🇺🇸 Vereinigte Staaten – Remote

💵 $55 - $60 / Stunde

⏰ Vollzeit

🟠 Senior

🔴 Experte

🖥 Softwareentwickler

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 3 Monaten

Intus Care

11 - 50

⚕️ Krankenversicherung

☁️ SaaS

🤖 Künstliche Intelligenz

Director of Engineering at Intus Care overseeing engineering teams for SaaS product development. Leading multiple engineering pods to build scalable healthcare technology solutions.

🇺🇸 Vereinigte Staaten – Remote

💵 $170.000 - $190.000 / Jahr

💰 €13.100.000 Venture Round im 2023-01

⏰ Vollzeit

🔴 Experte

🖥 Softwareentwickler

🦅 H1B-Visum-Sponsor

info

🗣️🇺🇸🇬🇧 Englisch erforderlich