Senior Site Reliability Engineer, Kong Konnect

🕒 Novembro 6, 2025

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Kong Inc.

Kong Inc.

201 - 500 funcionários

Fundada em 2017

🔌 API

☁️ SaaS

🏢 Corporativo

💰 $100.000.000 Series D em 2021-02

API • SaaS • Enterprise

Kong Inc. é uma empresa que oferece uma plataforma de APIs abrangente, projetada para facilitar o gerenciamento de APIs, a integração de IA e a produtividade de desenvolvedores. A companhia disponibiliza soluções como Kong Gateway, Kong Konnect e uma variedade de outras ferramentas voltadas ao gerenciamento e à otimização do ciclo de vida de APIs. A plataforma da Kong oferece suporte a ambientes multicloud e foi criada para entregar alto desempenho e segurança. É reconhecida pela Gartner como líder em gerenciamento de APIs e sustenta inovações em setores como serviços financeiros, saúde e tecnologia. A empresa enfatiza flexibilidade, segurança e velocidade, tornando-se a escolha preferida de organizações que buscam aprimorar seus serviços digitais por meio de APIs. A Kong também apoia uma comunidade robusta de desenvolvedores e oferece um amplo conjunto de integrações e plugins para simplificar o gerenciamento e as operações de APIs.

Descrição

• Operate and scale Kong’s global SaaS platform (Konnect), ensuring reliability, availability, and performance across regions and clouds. • Build, automate, and maintain Kubernetes-based infrastructure and deployment workflows using Terraform/Terragrunt, Helm, and ArgoCD. • Design, maintain, and optimize multi-region data and caching layers — including PostgreSQL, Redis, ClickHouse, and Druid — for high availability and low latency. • Operate and improve Kong Gateway and Kong Mesh environments supporting hybrid and distributed architectures. • Develop and maintain CI/CD pipelines and GitOps workflows to automate service delivery and ensure consistent infrastructure changes. • Enhance observability and incident response readiness through systems like Datadog, Prometheus, Grafana, and Thanos, defining and tracking SLOs. • Collaborate closely with development and security teams to ensure smooth operation of SaaS services in compliance with reliability, security, and regulatory standards. • Participate in a global 24/7 on-call rotation and drive continuous improvement of operational playbooks and postmortem practices. • Lead and contribute to scaling initiatives that improve elasticity, reliability, and cost-efficiency across the SaaS platform.

🎯 Requisitos

• BS in Computer Science or equivalent practical experience. • Demonstrated experience running and scaling SaaS platforms in production, ideally across multiple cloud providers. • Deep expertise in Kubernetes, including debugging cluster/networking issues and designing for fault tolerance and scalability. • Strong proficiency with Infrastructure as Code tools like Terraform or Terragrunt. • Experience with CI/CD pipelines and GitOps workflows (ArgoCD, Atlantis, Helm). • Proficiency in one or more programming languages (Go, Python, Bash) for automation and tooling. • Solid understanding of Linux/Unix systems, networking (DNS, TLS/SSL, HTTP), and distributed systems. • Familiarity with streaming systems like Kafka and observability platforms (Datadog, Prometheus, Grafana). • Experience working in a 24/7/365 production support environment.

🏖️ Benefícios

• Health insurance • Professional development opportunities

Candidatar-se

Vagas Similares

🕒 Outubro 14, 2025

Cerebras Systems

201 - 500

🤖 Inteligência Artificial

🔧 Hardware

⚕️ Seguro de Saúde

Sr. Deployment Engineer building and operating AI inference clusters for Cerebras Systems. Working with the world's largest AI chip to ensure scalable delivery of AI workloads.

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Outubro 7, 2025

Atolio

11 - 50

🤖 Inteligência Artificial

🏢 Corporativo

☁️ SaaS

Deployment Engineer working with engineering and client success teams at Atolio. Ensure efficient deployment of enterprise search platform in various environments.

🇨🇦 Canadá – Remoto

💵 CA$150.000 - CA$200.000 / ano

⏰ Tempo Integral

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Setembro 19, 2025

Veeva Systems

1001 - 5000

☁️ SaaS

⚕️ Seguro de Saúde

💊 Farmacêutico

DevOps Engineer building scalable cloud and CI/CD infrastructure for Veeva Systems' life sciences SaaS. Focus on IaC, automation, Kubernetes, Terraform, and reliability.

🇨🇦 Canadá – Remoto

💵 CA$85.000 - CA$225.000 / ano

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Setembro 16, 2025

Veeva Systems

1001 - 5000

☁️ SaaS

⚕️ Seguro de Saúde

💊 Farmacêutico

DevOps Engineer building scalable AWS infrastructure, CI/CD, and containerized deployments for Veeva's life sciences cloud; focuses on automation, reliability, and mentorship.

🇨🇦 Canadá – Remoto

💵 $85.000 - $225.000 / ano

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Setembro 10, 2025

Veeva Systems

1001 - 5000

☁️ SaaS

⚕️ Seguro de Saúde

💊 Farmacêutico

DevOps Engineer building scalable cloud infrastructure at Veeva Systems. Ensuring reliable, automated delivery of SaaS products for life sciences customers.

🇨🇦 Canadá – Remoto

💵 $85.000 - $225.000 / ano

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)