Senior Deployment Engineer, AI Inference

🕒 Outubro 14, 2025

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Cerebras Systems

Cerebras Systems

201 - 500 funcionários

Fundada em 2016

🤖 Inteligência Artificial

🔧 Hardware

⚕️ Seguro de Saúde

Artificial Intelligence • Hardware • Healthcare Insurance

A Cerebras Systems é uma empresa pioneira que se concentra no desenvolvimento de hardware avançado para IA, especificamente o Cerebras Wafer Scale Engine, que oferece desempenho incomparável em inferência de IA, superando as configurações tradicionais de GPU. Sua tecnologia de ponta permite que organizações como a Mayo Clinic e a AlphaSense executem modelos de IA de última geração com velocidade e eficiência notáveis. Com opções de implantação flexíveis, incluindo soluções em nuvem e locais, a Cerebras está transformando o cenário das capacidades de IA para equipes inovadoras em vários setores.

Descrição

• Deploy AI inference replicas and cluster software across multiple datacenters. • Operate across heterogeneous datacenter environments undergoing rapid 10x growth. • Maximize capacity allocation and optimize replica placement using constraint-solver algorithms. • Operate bare-metal inference infrastructure while supporting transition to K8S-based platform. • Develop and extend telemetry, observability and alerting solutions to ensure deployment reliability at scale. • Develop and extend a fully automated deployment pipeline to support fast software updates and capacity reallocation at scale. • Translate technical and customer needs into actionable requirements for the Dev Infra, Cluster, Platform and Core teams. • Stay up to date with the latest advancements in AI compute infrastructure and related technologies.

🎯 Requisitos

• 5-7 years of experience in operating on-prem compute infrastructure (ideally in Machine Learning or High-Performance Compute) or developing and managing complex AWS plane infrastructure for hybrid deployments. • Strong proficiency in Python for automation, orchestration, and deployment tooling. • Solid understanding of Linux-based systems and command-line tools. • Extensive knowledge of Docker containers and container orchestration platforms like K8S. • Familiarity with spine-leaf (Clos) networking architecture. • Proficiency with telemetry and observability stacks such as Prometheus, InfluxDB and Grafana. • Strong ownership mindset and accountability for complex deployments. • Ability to work effectively in a fast-paced environment.

🏖️ Benefícios

• Build a breakthrough AI platform beyond the constraints of the GPU. • Publish and open source their cutting-edge AI research. • Work on one of the fastest AI supercomputers in the world. • Enjoy job stability with startup vitality. • Our simple, non-corporate work culture that respects individual beliefs.

Candidatar-se

Vagas Similares

🕒 Outubro 7, 2025

Atolio

11 - 50

🤖 Inteligência Artificial

🏢 Corporativo

☁️ SaaS

Deployment Engineer working with engineering and client success teams at Atolio. Ensure efficient deployment of enterprise search platform in various environments.

🇨🇦 Canadá – Remoto

💵 CA$150.000 - CA$200.000 / ano

⏰ Tempo Integral

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Setembro 19, 2025

Veeva Systems

1001 - 5000

☁️ SaaS

⚕️ Seguro de Saúde

💊 Farmacêutico

DevOps Engineer building scalable cloud and CI/CD infrastructure for Veeva Systems' life sciences SaaS. Focus on IaC, automation, Kubernetes, Terraform, and reliability.

🇨🇦 Canadá – Remoto

💵 CA$85.000 - CA$225.000 / ano

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Setembro 16, 2025

Veeva Systems

1001 - 5000

☁️ SaaS

⚕️ Seguro de Saúde

💊 Farmacêutico

DevOps Engineer building scalable AWS infrastructure, CI/CD, and containerized deployments for Veeva's life sciences cloud; focuses on automation, reliability, and mentorship.

🇨🇦 Canadá – Remoto

💵 $85.000 - $225.000 / ano

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Setembro 10, 2025

Veeva Systems

1001 - 5000

☁️ SaaS

⚕️ Seguro de Saúde

💊 Farmacêutico

DevOps Engineer building scalable cloud infrastructure at Veeva Systems. Ensuring reliable, automated delivery of SaaS products for life sciences customers.

🇨🇦 Canadá – Remoto

💵 $85.000 - $225.000 / ano

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🕒 Setembro 9, 2025

TextNow

51 - 200

📡 Telecomunicações

Senior SRE owning infrastructure, reliability, and CI/CD for TextNow, a provider of free phone service

🇨🇦 Canadá – Remoto

💵 $113.400 - $162.000 / ano

⏰ Tempo Integral

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇺🇸🇬🇧 Inglês obrigatório