Senior Site Reliability Engineer (SRE)

🔥 0 minutos atrás

🗣️🇺🇸🇬🇧 Inglês obrigatório

🗣️🇧🇷🇵🇹 Português obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Oowlish

Oowlish

51 - 200 funcionários

Fundada em 2017

🤝 B2B

💳 Fintech

B2B • Software Development • Fintech

Oowlish é uma empresa de tecnologia especializada em fornecer soluções end-to-end para negócios que buscam inovar por meio do desenvolvimento de produtos e serviços digitais. Sua missão é democratizar a inovação ao conectar empresas de todos os portes a talentos de tecnologia altamente qualificados, especialmente de países em desenvolvimento. A empresa enfatiza a colaboração por meio de desenvolvimento de software sob medida, UX/UI design, Product Management e metodologias ágeis. A Oowlish também investe em startups por meio da Oowlish Ventures, ajudando empreendedores a co-desenhar e escalar suas ideias em produtos de sucesso.

Descrição

• Design, implement, and improve Site Reliability Engineering practices across production environments. • Define, manage, and continuously improve Service Level Objectives (SLOs), Service Level Indicators (SLIs), and Error Budgets. • Lead and participate in incident response and incident command processes. • Build and evolve observability strategies, including monitoring, logging, alerting, and distributed tracing. • Improve system reliability, availability, scalability, and operational efficiency. • Partner with engineering teams to improve application performance and production readiness. • Develop automation solutions that reduce operational overhead and improve reliability. • Participate in root cause analysis and post-incident reviews. • Drive continuous improvement initiatives based on operational insights and incident learnings. • Help establish reliability best practices across teams and services.

🎯 Requisitos

• 5+ years of professional experience in Site Reliability Engineering, DevOps, or Production Engineering roles. • Strong understanding of Site Reliability Engineering principles and best practices. • Experience supporting and operating production systems at scale. • Strong knowledge of monitoring, observability, and reliability engineering concepts. • Experience working in cloud-based environments. • Strong troubleshooting and problem-solving skills. • Experience working with distributed systems and modern application architectures. • Proven Site Reliability Engineering experience. • Experience in defining and managing: • Service Level Objectives (SLOs) • Service Level Indicators (SLIs) • Error Budgets • Experience leading or actively participating in Incident Command and Incident Response processes. • Experience designing and implementing observability strategies. • Hands-on experience with: • Monitoring • Logging • Alerting • Distributed Tracing • Experience improving system reliability, availability, and operational excellence. • Experience supporting mission-critical production environments. • Experience with cloud platforms (AWS preferred). • Strong automation mindset. • Experience conducting root cause analysis and postmortems. • Kubernetes experience. • Terraform or Infrastructure as Code experience. • CI/CD pipeline experience. • Experience with containerized environments. • Experience with distributed microservices architectures. • Experience with performance engineering. • Experience mentoring engineers on reliability practices. • Multi-cloud experience. • Experience working in highly regulated or high-availability environments.

🏖️ Benefícios

• Home office; • Competitive compensation based on experience; • Career plans to allow for extensive growth in the company; • International Projects; • Oowlish English Program (Technical and Conversational); • Oowlish Fitness with Total Pass; • Games and Competitions;

Candidatar-se

Vagas Similares

🔥 3 horas atrás

Segware

51 - 200

🔐 Segurança

🤖 Inteligência Artificial

☁️ SaaS

Vaga de SRE / SecOps Sênior para aprimorar segurança e desempenho na Segware. Colaboração com times para implementar soluções inovadoras em monitoramento de software visando o crescimento dos clientes.

🗣️🇧🇷🇵🇹 Português obrigatório

🔥 3 horas atrás

Segware

51 - 200

🔐 Segurança

🤖 Inteligência Artificial

☁️ SaaS

SRE/DevOps Sênior responsável por gerenciar ambientes complexos, garantindo estabilidade e desempenho. Colabora em projetos de automação e melhorias de infraestrutura enquanto reduz custos.

🗣️🇧🇷🇵🇹 Português obrigatório

🔥 14 horas atrás

OZmap

11 - 50

☁️ SaaS

📡 Telecomunicações

🤝 B2B

Engenheiro Sênior de Plataforma na Ozmap responsável por ambientes AWS e Linux, resolução de problemas e construção de pipelines de CI/CD para entrega contínua.

🗣️🇧🇷🇵🇹 Português obrigatório

🔥 16 horas atrás

Compass

10.000+ funcionários

🏠 Imobiliário

📱 Mídia

Analista de Segurança DevSecOps focado em práticas de segurança e gerenciamento de vulnerabilidades para a Compass UOL. Envolve colaboração com equipes de desenvolvimento para implementar medidas de segurança.

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 3 dias atrás

CI&T

5001 - 10000

🤖 Inteligência Artificial

☁️ SaaS

Analista SRE/Desenvolvedor garantindo resiliência e observabilidade na CI&T, aproveitando IA e soluções tecnológicas integradas.

🗣️🇧🇷🇵🇹 Português obrigatório