SRE Sênior (Tarde/ Noite)

1001 - 5000 funcionários

Fundada em 1989

🏦 Bancário

💸 Finanças

💳 Fintech

Banking • Finance • Fintech

O Banco ABC Brasil é uma instituição financeira especializada em oferecer soluções financeiras sob medida para pessoas e empresas. Com uma equipe multidisciplinar altamente qualificada, tem como foco promover o crescimento por meio de relacionamentos de longo prazo, pautados por lealdade, transparência e resultados. Oferece serviços como assessoria de investimentos para pessoas físicas, gestão financeira corporativa, corretagem de seguros e soluções para o mercado de energia, com o objetivo de ajudar os clientes a maximizar seus resultados financeiros.

SRE Sênior (Tarde/ Noite)

🕒 Maio 19

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Cloud

Grafana

Kubernetes

NFS

Prometheus

Python

Terraform

Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Banco ABC Brasil

1001 - 5000 funcionários

Fundada em 1989

🏦 Bancário

💸 Finanças

💳 Fintech

Banking • Finance • Fintech

Descrição

• Gestão de Capacidade, Performance e Disponibilidade • Planejar e ajustar continuamente a capacidade de recursos computacionais (compute, memoria, storage e rede) em AWS e on-premises, antecipando gargalos e evitando desperdício. • Monitorar, analisar e otimizar a performance de serviços e infraestrutura, identificando degradações antes que impactem usuários finais (uso das metodologias USE e RED). • Definir, implementar e manter SLOs, SLAs e error budgets, garantindo alta disponibilidade por meio de automações e runbooks bem documentados. • Construir e manter controles automatizados que assegurem os KPIs de confiabilidade acordados com o negócio, com rastreabilidade e auditabilidade. • Criar e evoluir automações de operação — scaling reativo e preditivo, remediação automática, provisionamento zero-touch — reduzindo toil e aumentando resiliência. • Gerenciar e otimizar clusters EKS: provisionamento, escalabilidade (HPA / VPA / Cluster Autoscaler / Karpenter), redes, storage e troubleshooting de workloads em produção. • Garantir infraestrutura versionada, reprodutivel e auditavel. • Realizar chaos engineering para validar resiliencia de sistemas (simulacao de falhas controladas, game days). • Manter stacks completas de observabilidade: métricas, logs, tracing distribuído e alertas orientados a SLOs. • Construir dashboards e alertas com Prometheus, Grafana e CloudWatch, com visibilidade de ponta a ponta sobre saúde da infraestrutura. • Aplicar conceitos e práticas de otimização de custos em cloud: rightsizing, reserved instances, savings plans e spot instances. • Produzir relatórios e recomendações de redução de custos em AWS, utilizando AWS Cost Explorer, Kubecost ou equivalente. • Implementar tagging e chargeback para visibilidade de custo por serviço, squad ou produto, promovendo cultura FinOps no time. • Atuar em escala de plantão (on-call), liderar resolução de incidentes de alta severidade e conduzir post-mortems sem cultura de culpa com action items concretos. • Apoiar SREs, disseminando práticas de confiabilidade, observabilidade e cultura de engenharia de operações. • Atuar como referência técnica para decisões de arquitetura de infraestrutura relacionadas a confiabilidade, capacidade e performance. • Atuar com revisões técnicas de infraestrrutura com o time de engenharia cloud.

🎯 Requisitos

• Experiencia solida em gestão de capacidade e performance em ambientes híbridos (cloud + on-premises) com responsabilidade comprovada por SLOs e KPIs. • Domínio avançado de AWS: compute, storage, rede, IAM e serviços gerenciados em escala de producao. • Kubernetes/EKS em produção: provisionamento, troubleshooting, scaling e storage com experiencia mínima de 4 anos. • Terraform em nível produção: módulos, remote state, workspaces e reconciliacao de drift. • Observabilidade de ponta a ponta: metricas, logs, tracing, alertas orientados a SLOs e criação de dashboards operacionais. • Storage hibrido: domínio de tipos EBS, EFS, FSx em cloud e SAN/NAS/NFS on-premises, incluindo planejamento de IOPS e capacidade. • Python ou Bash para automações e ferramentas internas. • O candidato deve possuir ao menos uma certificação nas frentes de SRE e Cloud AWS. A ausência total de certificações em ambas as frentes, sem portfolio técnico solido comprovado, e fator eliminatório. A AWS Solutions Architect (Associate ou Professional) e o diferencial de maior peso dentro da frente cloud.

🏖️ Benefícios

• Assistência Médica; • Assistência Odontológica Omint; • Seguro de Vida; • PLR; • PPR; • ABC com Você: um programa que cuida dos colaboradores e seus familiares, com assistência jurídica, social, psicológica e financeira; • Vale Refeição; • Vale Alimentação; • Licença Paternidade e Maternidade estendidas: paternidade 20 dias e maternidade 6 meses; • Auxílio Creche/Babá; • Day Off anual; • Auxílio Infraestrutura para Home Office; • TotalPass;

Vagas Similares

Especialista DevOps

🕒 Maio 19

Stefanini Brasil

10.000+ funcionários

🤖 Inteligência Artificial

🔒 Cibersegurança

Especialista DevOps na Stefanini garantindo alta confiabilidade e escalabilidade das plataformas de agentes. Envolve construir a camada de execução, implementar monitoramento e automatizar deploys.

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Azure

Cloud

Google Cloud Platform

SRE / Infra Engineer Sênior | TRACK&FIELD | São Paulo

🕒 Maio 18

TRACK&FIELD

501 - 1000

🛒 Varejo

🛍️ Comércio Eletrônico

⚽ Esportes

SRE/Engenheiro de Infraestrutura garantindo a estabilidade e segurança da infraestrutura de TI da TFSports. Foco em alta disponibilidade e desempenho para as operações de negócio no Brasil.

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Cloud

DNS

EC2

Flux

Kubernetes

Python

Terraform

Analista DevOps

🕒 Maio 14

Avanade

10.000+ funcionários

☁️ SaaS

🤝 B2B

🏢 Corporativo

Engenheiro(a) DevOps gerenciando pipelines de CI/CD e ambientes em nuvem na Avanade. Contribuindo para projetos estratégicos de transformação digital e garantindo confiabilidade e escalabilidade das plataformas.

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Azure

Cloud

Docker

ETL

Google Cloud Platform

Grafana

Jenkins

Kubernetes

Linux

Prometheus

Python

Terraform

Analista SRE Sênior

🕒 Maio 6

INEX

51 - 200

🤝 B2B

🏢 Corporativo

🤖 Inteligência Artificial

Analista SRE liderando a disciplina de observabilidade nas Operações de TI. Responsável pela definição de níveis de serviço, métricas, troubleshooting e projetos de modernização na nuvem.

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

Grafana

Engenheiro(a) de DevOps (São Paulo, Brasil)

🕒 Maio 4

Novibet

501 - 1000

🎲 Jogos de Azar

🎮 Jogos

🛍️ Comércio Eletrônico

Engenheiro(a) de DevOps na sede brasileira da Novibet em São Paulo, responsável pela manutenção da infraestrutura e pelas estratégias de deploy.

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇺🇸🇬🇧 Inglês obrigatório

Ansible

AWS

Azure

Chef

Cloud

Docker

Google Cloud Platform

Grafana

HAProxy

Jenkins

Kubernetes

Linux

MongoDB

MySQL

NGINX

OpenShift

PHP

Postgres

Prometheus

Puppet

Python

RabbitMQ

Redis

SaltStack

Splunk

Terraform