SRE Sênior (Tarde/ Noite)

🕒 Maio 19

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Banco ABC Brasil

Banco ABC Brasil

SiteLinkedIn

1001 - 5000 funcionários

Fundada em 1989

🏦 Bancário

💸 Finanças

💳 Fintech

Banking • Finance • Fintech

O Banco ABC Brasil é uma instituição financeira especializada em oferecer soluções financeiras sob medida para pessoas e empresas. Com uma equipe multidisciplinar altamente qualificada, tem como foco promover o crescimento por meio de relacionamentos de longo prazo, pautados por lealdade, transparência e resultados. Oferece serviços como assessoria de investimentos para pessoas físicas, gestão financeira corporativa, corretagem de seguros e soluções para o mercado de energia, com o objetivo de ajudar os clientes a maximizar seus resultados financeiros.

Descrição

• Gestão de Capacidade, Performance e Disponibilidade • Planejar e ajustar continuamente a capacidade de recursos computacionais (compute, memoria, storage e rede) em AWS e on-premises, antecipando gargalos e evitando desperdício. • Monitorar, analisar e otimizar a performance de serviços e infraestrutura, identificando degradações antes que impactem usuários finais (uso das metodologias USE e RED). • Definir, implementar e manter SLOs, SLAs e error budgets, garantindo alta disponibilidade por meio de automações e runbooks bem documentados. • Construir e manter controles automatizados que assegurem os KPIs de confiabilidade acordados com o negócio, com rastreabilidade e auditabilidade. • Criar e evoluir automações de operação — scaling reativo e preditivo, remediação automática, provisionamento zero-touch — reduzindo toil e aumentando resiliência. • Gerenciar e otimizar clusters EKS: provisionamento, escalabilidade (HPA / VPA / Cluster Autoscaler / Karpenter), redes, storage e troubleshooting de workloads em produção. • Garantir infraestrutura versionada, reprodutivel e auditavel. • Realizar chaos engineering para validar resiliencia de sistemas (simulacao de falhas controladas, game days). • Manter stacks completas de observabilidade: métricas, logs, tracing distribuído e alertas orientados a SLOs. • Construir dashboards e alertas com Prometheus, Grafana e CloudWatch, com visibilidade de ponta a ponta sobre saúde da infraestrutura. • Aplicar conceitos e práticas de otimização de custos em cloud: rightsizing, reserved instances, savings plans e spot instances. • Produzir relatórios e recomendações de redução de custos em AWS, utilizando AWS Cost Explorer, Kubecost ou equivalente. • Implementar tagging e chargeback para visibilidade de custo por serviço, squad ou produto, promovendo cultura FinOps no time. • Atuar em escala de plantão (on-call), liderar resolução de incidentes de alta severidade e conduzir post-mortems sem cultura de culpa com action items concretos. • Apoiar SREs, disseminando práticas de confiabilidade, observabilidade e cultura de engenharia de operações. • Atuar como referência técnica para decisões de arquitetura de infraestrutura relacionadas a confiabilidade, capacidade e performance. • Atuar com revisões técnicas de infraestrrutura com o time de engenharia cloud.

🎯 Requisitos

• Experiencia solida em gestão de capacidade e performance em ambientes híbridos (cloud + on-premises) com responsabilidade comprovada por SLOs e KPIs. • Domínio avançado de AWS: compute, storage, rede, IAM e serviços gerenciados em escala de producao. • Kubernetes/EKS em produção: provisionamento, troubleshooting, scaling e storage com experiencia mínima de 4 anos. • Terraform em nível produção: módulos, remote state, workspaces e reconciliacao de drift. • Observabilidade de ponta a ponta: metricas, logs, tracing, alertas orientados a SLOs e criação de dashboards operacionais. • Storage hibrido: domínio de tipos EBS, EFS, FSx em cloud e SAN/NAS/NFS on-premises, incluindo planejamento de IOPS e capacidade. • Python ou Bash para automações e ferramentas internas. • O candidato deve possuir ao menos uma certificação nas frentes de SRE e Cloud AWS. A ausência total de certificações em ambas as frentes, sem portfolio técnico solido comprovado, e fator eliminatório. A AWS Solutions Architect (Associate ou Professional) e o diferencial de maior peso dentro da frente cloud.

🏖️ Benefícios

• Assistência Médica; • Assistência Odontológica Omint; • Seguro de Vida; • PLR; • PPR; • ABC com Você: um programa que cuida dos colaboradores e seus familiares, com assistência jurídica, social, psicológica e financeira; • Vale Refeição; • Vale Alimentação; • Licença Paternidade e Maternidade estendidas: paternidade 20 dias e maternidade 6 meses; • Auxílio Creche/Babá; • Day Off anual; • Auxílio Infraestrutura para Home Office; • TotalPass;

Candidatar-se

Vagas Similares

🕒 Maio 19

Stefanini Brasil

10.000+ funcionários

🤖 Inteligência Artificial

🔒 Cibersegurança

SiteLinkedIn

Especialista DevOps na Stefanini garantindo alta confiabilidade e escalabilidade das plataformas de agentes. Envolve construir a camada de execução, implementar monitoramento e automatizar deploys.

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 Maio 18

TRACK&FIELD

501 - 1000

🛒 Varejo

🛍️ Comércio Eletrônico

⚽ Esportes

SiteLinkedIn

SRE/Engenheiro de Infraestrutura garantindo a estabilidade e segurança da infraestrutura de TI da TFSports. Foco em alta disponibilidade e desempenho para as operações de negócio no Brasil.

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 Maio 14

Avanade

10.000+ funcionários

☁️ SaaS

🤝 B2B

🏢 Corporativo

SiteLinkedIn

Engenheiro(a) DevOps gerenciando pipelines de CI/CD e ambientes em nuvem na Avanade. Contribuindo para projetos estratégicos de transformação digital e garantindo confiabilidade e escalabilidade das plataformas.

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 Maio 6

INEX

51 - 200

🤝 B2B

🏢 Corporativo

🤖 Inteligência Artificial

SiteLinkedIn

Analista SRE liderando a disciplina de observabilidade nas Operações de TI. Responsável pela definição de níveis de serviço, métricas, troubleshooting e projetos de modernização na nuvem.

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 Maio 4

Novibet

501 - 1000

🎲 Jogos de Azar

🎮 Jogos

🛍️ Comércio Eletrônico

SiteLinkedIn

Engenheiro(a) de DevOps na sede brasileira da Novibet em São Paulo, responsável pela manutenção da infraestrutura e pelas estratégias de deploy.

🏢🏡 São Paulo – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

⛑ DevOps & Engenheiro de Confiabilidade do Site (SRE)

🗣️🇺🇸🇬🇧 Inglês obrigatório