Operations Engineer, Fleet Reliability

Vaga não está no LinkedIn

🕒 Maio 14

🇺🇸 Estados Unidos – Remoto (EUA)

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⚙️ Operações

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of fal

fal

51 - 200 funcionários

🤖 Inteligência Artificial

🔌 API

🏢 Corporativo

Artificial Intelligence • API • Enterprise

A fal é uma plataforma de mídia generativa para desenvolvedores que fornece uma grande galeria de modelos generativos de imagem, vídeo, áudio e 3D, prontos para produção e acessíveis por APIs simples. Oferece inferência de GPU sem servidor, distribuída globalmente, clusters sob demanda e dedicados para ajuste fino e treinamento, além de ferramentas para implantar modelos privados ou personalizados com segurança e capacidade de observação de nível empresarial. A fal tem como alvo desenvolvedores e empresas que necessitam de uma infraestrutura de IA generativa escalável, com recursos como conformidade com SOC 2, precificação baseada em uso e integrações para rápida colocação no mercado.

Descrição

• Provision, validate, and triage GPU nodes across B300, H200, and H100 clusters • Troubleshoot hardware and software issues across compute, network, and storage • Monitor fleet health, take remediation action, push fixes upstream when needed • Write the runbooks. Improve the ones that exist. Delete the ones that don't work

🎯 Requisitos

• Administered Linux Systems in the critical path before • Troubleshooted GPU node issues: NVLink, NCCL, IB, driver and firmware bugs • Has experience in observability systems like Grafana and Prometheus • Scripted your way out of repetitive work (bash, python, go, whatever)

Candidatar-se

Vagas Similares

🕒 Maio 14

Capricor Therapeutics, Inc.

51 - 200

🧬 Biotecnologia

💊 Farmacêutico

🔬 Ciência

Director responsible for commercial operations supporting Deramiocel launch at Capricor. Requires extensive experience in biopharmaceuticals and innovative commercial strategies.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $200.000 - $265.000 / ano

⏰ Tempo Integral

🟠 Sênior

⚙️ Operações

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Maio 14

Aledade, Inc.

501 - 1000

⚕️ Seguro de Saúde

🏢 Corporativo

🇺🇸 Estados Unidos – Remoto (EUA)

⏰ Tempo Integral

🟠 Sênior

⚙️ Operações

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Maio 14

Refresco

10.000+ funcionários

🤝 B2B

🛒 Varejo

Warehouse Operations Manager overseeing KPI data and ensuring Refresco Warehouse Standards compliance. Managing process improvements and training associates for logistics operations.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $103.140 - $123.138 / ano

💰 $432.761.799 Debt Financing - Refresco em 2024-07

⏰ Tempo Integral

🟠 Sênior

🔴 Especialista

⚙️ Operações

🦅 Patrocina Visto H1B

info

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Maio 14

Refresco

10.000+ funcionários

🤝 B2B

🛒 Varejo

Warehouse Operations Manager overseeing KPI data and assisting Plant Warehouse Managers with process improvements. Responsible for SAP implementations and managing warehouse KPI data tracker.

🇺🇸 Estados Unidos – Remoto (EUA)

💰 $432.761.799 Debt Financing - Refresco em 2024-07

⏰ Tempo Integral

🟠 Sênior

🔴 Especialista

⚙️ Operações

🦅 Patrocina Visto H1B

info

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Maio 14

Guild Mortgage

1001 - 5000

💸 Finanças

🏠 Imobiliário

Process Improvement Consultant at Guild Mortgage Company helping to enhance efficiency and optimize costs through process improvements. Responsible for collaboration across departments and evaluating ROI of initiatives.

🇺🇸 Estados Unidos – Remoto (EUA)

💵 $79.290 - $118.969 / ano

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⚙️ Operações

🗣️🇺🇸🇬🇧 Inglês obrigatório