Senior Engineer 2 – Inference Data Plane

🕒 Março 17

☕ Washington – Remoto

info

💵 $167.200 - $209.000 / ano

⏰ Tempo Integral

🟠 Sênior

🧑‍💻 Engenheiro Full-stack

🦅 Patrocina Visto H1B

info

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of DigitalOcean

DigitalOcean

1001 - 5000 funcionários

Fundada em 2011

☁️ SaaS

SaaS • Cloud Computing

A DigitalOcean é um provedor de infraestrutura em nuvem que oferece um conjunto de produtos e serviços para que desenvolvedores construam, implantem e dimensionem aplicações. Sua plataforma disponibiliza tutoriais abrangentes, materiais de referência e documentação de suporte para ajudar os usuários a gerenciar recursos de forma eficiente usando suas ferramentas de API e CLI. Com recursos como Droplets (máquinas virtuais), bancos de dados gerenciados, Kubernetes e um marketplace de aplicações de terceiros, a DigitalOcean prioriza simplicidade e desempenho. Atende tanto desenvolvedores individuais quanto organizações de maior porte que buscam soluções em nuvem fáceis de implementar e gerenciar.

Descrição

• Act as a technical leader on the team, driving the end-to-end design, development, and delivery of critical data plane components hosting large generative AI models. • Architect and refine system design proposals for our high-scale, multi-tenant AI inference cloud ecosystem, ensuring they meet rigorous availability and resiliency standards. • Implement and optimize distributed inference hosting using techniques like tensor/data parallelism, KV cache optimizations, and smart routing. • Work cross-functionally with Product Managers, customer-facing teams, and other engineering teams to align technical roadmaps with customer needs. • Coach and mentor junior engineers, fostering a culture of technical excellence and continuous improvement. • Maintain and operate critical, high-scale services, utilizing observability tools and defining SLOs to ensure superior platform health.

🎯 Requisitos

• Strong experience with microservices, messaging systems, databases, and infrastructure as code. • Hands-on experience hosting large language or multimodal models using inference engines like vLLM, SGLang, or Modular. • Familiarity with distributed inference serving frameworks such as llm-d, NVIDIA Dynamo, or Ray Serve. • Understanding of GPU-level optimization and experience with interconnect technologies like NVlink, XGMI, or RoCE. • Knowledge of common LLM architectures and optimization techniques (e.g., continuous batching, quantization). • Expert-level proficiency in GoLang or Python and familiarity with gRPC. • Proven experience shipping customer-facing software products and running critical services in a high-scale environment similar to DigitalOcean. • Experience integrating and building with open-source software.

🏖️ Benefícios

• Employee Assistance Program • Local Employee Meetups • Flexible time off policy • Reimbursement for relevant conferences, training, and education • Access to LinkedIn Learning's 10,000+ courses

Candidatar-se

Vagas Similares

🕒 Março 17

Akamai Technologies

5001 - 10000

🔒 Cibersegurança

Lead a team of developers building security solutions at Akamai. Focus on innovative enterprise security products for government and defense customers.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $146.400 - $263.600 / ano

💰 Post-IPO Equity em 2001-07

⏰ Tempo Integral

🟠 Sênior

🧑‍💻 Engenheiro Full-stack

🦅 Patrocina Visto H1B

info

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Março 17

Cornelis Networks

51 - 200

🤖 Inteligência Artificial

🔧 Hardware

🏢 Corporativo

Senior Software Engineer designing and optimizing AI communication middleware at Cornelis Networks. Collaborating on performance-critical projects in a remote position for U.S. residents.

🇺🇸 Estados Unidos – Remoto (EUA)

💰 $29.000.000 Series B em 2022-11

⏰ Tempo Integral

🟠 Sênior

🧑‍💻 Engenheiro Full-stack

🦅 Patrocina Visto H1B

info

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Março 17

Owens Corning

10.000+ funcionários

Controls and Automation Project Manager for Owens Corning, leading projects in Robotics and Automation. Responsible for technical depth, project leadership, and team development.

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Março 17

Clever Real Estate

51 - 200

🏠 Imobiliário

🏪 Marketplace

👥 B2C

Full Stack Software Engineer developing backend systems at Clever, a real estate technology company. Shaping the future of the industry through innovative solutions and collaboration.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $140.000 - $160.000 / ano

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🧑‍💻 Engenheiro Full-stack

🦅 Patrocina Visto H1B

info

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Março 16

Fingerprint

51 - 200

🔒 Cibersegurança

🔌 API

☁️ SaaS

Full Stack Engineer for Fingerprint developing a dashboard for fraud detection. Lead front-end and back-end development tasks in a remote, collaborative environment.

🇺🇸 Estados Unidos – Remoto (EUA)

💰 $32.000.000 Series B em 2021-11

⏰ Tempo Integral

🟠 Sênior

🔴 Especialista

🧑‍💻 Engenheiro Full-stack

🗣️🇺🇸🇬🇧 Inglês obrigatório