Site Reliability Engineer Specialist

51 - 200 funcionários

Fundada em 2017

☁️ SaaS

🔌 API

🏢 Corporativo

💰 $60.492.408 Series B - Digibee em 2023-06

SaaS • API • Enterprise

A Digibee é uma plataforma de integração e automação nativa da nuvem que ajuda as empresas a conectar aplicativos, sistemas legados, dados e IA. Ela fornece ferramentas visuais/low-code para criar integrações, orquestrar fluxos de trabalho, implantar agentes e gerenciar a conectividade MCP/IA com observabilidade, segurança e escalabilidade serverless integradas. A Digibee é oferecida como uma plataforma SaaS para equipes de TI, desenvolvedores e arquitetos acelerarem a transformação digital, modernizarem sistemas centrais e automatizarem processos críticos de alta demanda.

Site Reliability Engineer Specialist

🔥 0 minutos atrás

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

🔴 Especialista

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

🗣️🇺🇸🇬🇧 Inglês obrigatório

ElasticSearch

Java

JavaScript

Kubernetes

Logstash

MongoDB

Node.js

Postgres

Prometheus

RabbitMQ

Redis

Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Digibee

51 - 200 funcionários

Fundada em 2017

☁️ SaaS

🔌 API

🏢 Corporativo

💰 $60.492.408 Series B - Digibee em 2023-06

SaaS • API • Enterprise

Descrição

• Own the technical direction of our observability stack (Dash0, OpenTelemetry, Elasticsearch/Logstash/Fluent Bit) — defining instrumentation standards for Java and Node.js services and driving adoption of tracing, metrics, and structured logging. • Establish meaningful SLIs, SLOs, and error budgets, and partner with engineering and product teams to use them to drive real engineering decisions. • Lead major incident response as a senior incident commander, and run blameless postmortems with technical depth and real follow-through. • Evolve our on-call program so it is humane and sustainable — driving down toil and alert noise as a first-class engineering priority. • Influence architecture decisions across the platform, going deep where it matters: GKE, Kong, RabbitMQ, PostgreSQL, MongoDB Atlas, Redis, and MinIO. • Mentor SREs and platform engineers, raise the technical bar through design and incident reviews, and grow the SRE discipline at Digibee.

🎯 Requisitos

• 8+ years in SRE, infrastructure, or platform engineering, with meaningful time at Specialist or Principal level operating large-scale production systems — this is a mandatory requirement. • Deep production experience with Kubernetes (preferably GKE), including real fluency debugging things under pressure. • Strong observability background with OpenTelemetry, Prometheus, distributed tracing, and centralized logging (Elasticsearch, Logstash, Fluent Bit, or similar). Experience with Dash0 is a strong plus. • Hands-on experience operating stateful services in production: at least two of PostgreSQL, MongoDB Atlas, Redis, RabbitMQ, or object storage (MinIO/S3). • Production experience instrumenting and troubleshooting Java services (JVM tuning, GC, thread dumps); familiarity with Node.js runtime characteristics is a plus. • Proven track record leading incident response and SLO programs that actually changed engineering behavior — not dashboards nobody looks at. • Demonstrated ability to mentor senior engineers and influence technical direction across teams without formal authority. • Strong communication skills in both English and Portuguese (written and verbal), with proven ability to collaborate across cross-functional, remote-first teams.

🏖️ Benefícios

• Health care • Dental care • R$ 1.400,00/month on Caju card (for food and meal allowance, mobility, home office supplies, culture, health, and education) • Life insurance • Child care assistance • Equity (RSU's) • Gympass • English course: we have a partnership for group classes for R$100 monthly

Vagas Similares

OI | Especialista DevOps

🕒 Ontem

C&A Brasil

10.000+ funcionários

🛒 Varejo

🛍️ Comércio Eletrônico

👗 Moda

Especialista Líder DevOps na C&A, promovendo uma cultura tecnológica inovadora e colaborativa. Garantindo alto desempenho e confiabilidade em plataformas de nuvem.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Azure

Cloud

Docker

Google Cloud Platform

Grafana

GraphQL

Kubernetes

Linux

OpenShift

Prometheus

Splunk

Terraform

CAS | Analista DevOps/SRE SR

🕒 Ontem

Sicredi

10.000+ funcionários

🏦 Bancário

💸 Finanças

Analista DevOps/SRE promovendo entrega contínua no Sicredi. Atuará em ambiente multi-cloud e na integração de ferramentas entre times.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Cloud

Consul

Docker

Grafana

Kubernetes

Linux

Node.js

PHP

Postgres

Prometheus

Python

Redis

Spring

Spring Boot

SpringBoot

SQL

Terraform

Vault

Especialista DevOps

🕒 Ontem

CEA

201 - 500

🌾 Agricultura

🔧 Hardware

🤝 B2B

Especialista DevOps na C&A gerenciando plataformas em nuvem e pipelines de CI/CD. Garantindo operações confiáveis e orientando equipes em um ambiente diverso e inovador.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Azure

Cloud

Docker

Google Cloud Platform

Grafana

GraphQL

Kubernetes

Linux

OpenShift

Prometheus

Splunk

Terraform

CAS | Analista DevOps/SRE SR

🕒 Ontem

Sicredi

10.000+ funcionários

🏦 Bancário

💸 Finanças

Vaga de Analista DevOps/SRE no Sicredi, com foco em tecnologias multi-cloud e na melhoria da confiabilidade dos serviços. Atue com diversas áreas para impulsionar a transformação digital e a entrega de serviços.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Cloud

Consul

Docker

Grafana

Kubernetes

Linux

Node.js

PHP

Postgres

Prometheus

Python

Redis

Spring

Spring Boot

SpringBoot

SQL

Terraform

Vault

Analista SRE Pl

🕒 Ontem

Addvisor Group

201 - 500

☁️ SaaS

📋 Conformidade

🏢 Corporativo

Analista SRE Pleno gerenciando projetos críticos de infraestrutura em nuvem para missões estratégicas, de forma remota no Brasil. Colaborando com equipes de desenvolvimento e garantindo as melhores práticas em operações de nuvem.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Cloud

Docker

EC2

Kubernetes

Linux

OpenShift

Oracle

Python

Terraform