Site Reliability Engineer (AWS) - Tecnologia

Novembro 4

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Logo of Truelogic Software

Truelogic Software

SaaS • B2B • Enterprise

Truelogic Software é uma empresa de desenvolvimento de software nearshore especializada em serviços de staff augmentation ágil. Focamos em oferecer desenvolvimento de software sob medida terceirizado, com uma equipe de engenheiros altamente qualificados da América Latina. A Truelogic Software faz parceria tanto com startups quanto com empresas da Fortune 500, oferecendo soluções alinhadas aos fusos horários de seus clientes e garantindo resultados de alta qualidade por meio de colaboração e agilidade na resposta. Com presença em mais de 25 países, a Truelogic valoriza o trabalho remoto para uma melhor qualidade de vida, e seus engenheiros têm experiência em diversos setores, entregando uma ampla variedade de projetos bem-sucedidos globalmente.

501 - 1000 funcionários

Fundada em 2004

☁️ SaaS

🤝 B2B

🏢 Corporativo

Descrição

• Desenha, implementa e evolui constructs compartilhados em AWS CDK e CDK8s usados por múltiplos serviços e times. • Mantém componentes de infraestrutura core, incluindo VPC, clusters EKS e node groups, RDS, OpenSearch e MSK. • Opera e estende addons de cluster Kubernetes, como ingress controllers, cert-manager, autoscalers e pilhas de monitoramento/log. • Garante alta confiabilidade por meio de sistemas estruturados de alertas (Prometheus, CloudWatch), estratégias de autoscaling e mecanismos de recuperação. • Gerencia e publica templates base, esquemas de configuração e documentação abrangente para o uso da infraestrutura. • É responsável pelos pipelines de CI/CD das bases de código de Infrastructure as Code (IaC) e pelas releases de componentes da plataforma. • Colabora com times de engenharia para diagnosticar problemas relacionados à infraestrutura e entregar soluções escaláveis e confiáveis. • Aplica princípios de Site Reliability Engineering (SRE) — incluindo SLIs, SLOs, observabilidade e tolerância a falhas — a todos os serviços compartilhados da plataforma. • Suporta práticas de IAM, gerenciamento de secrets e isolamento de tenants.

🎯 Requisitos

• Mínimo de 5+ anos de experiência em infraestrutura ou Site Reliability Engineering (SRE), incluindo atuação prática com serviços AWS como VPC, IAM, RDS, MSK e S3, além de componentes Kubernetes como Helm, RBAC e ServiceAccounts. • Domínio de Python e experiência prática com Infrastructure-as-Code usando AWS CDK, CDK8s ou frameworks equivalentes como Pulumi. • Forte entendimento de Prometheus, Grafana e práticas eficazes de roteamento de alertas. • Experiência no desenho de padrões de infraestrutura reutilizáveis ou na construção de plataformas internas para desenvolvedores. • Histórico comprovado de melhoria da confiabilidade de sistemas por meio de automação, monitoramento e boas práticas operacionais. • Experiência em suporte a Spark no Kubernetes, Argo ou pipelines batch baseadas em Kafka.

🏖️ Benefícios

• Trabalho 100% remoto: aproveite a liberdade de trabalhar do local que mais facilita sua produtividade. Tudo o que precisa é um laptop e conexão de internet confiável. • Remuneração altamente competitiva em USD: receba uma compensação excelente em dólares, acima da média do mercado. • Folgas remuneradas: valorizamos seu bem-estar; nossas políticas de folga remunerada garantem que você tenha tempo para descansar e recarregar quando necessário. • Trabalho com autonomia: liberdade para gerenciar seu tempo desde que o trabalho seja entregue; foco em resultados, não em horário. • Trabalho com grandes empresas americanas: desenvolva sua expertise em projetos inovadores e de alto impacto com empresas líderes dos EUA.

Candidatar-se

Vagas Similares

Outubro 28

InfoJobs

51 - 200

🎯 Recrutamento

🏪 Marketplace

DevOps responsável pela colaboração em automação com equipes de aplicações para a consultoria de TI Stefanini. Requer inglês avançado e experiência com Kubernetes, Docker e ferramentas de CI/CD.

🗣️🇺🇸🇬🇧 Inglês obrigatório

🗣️🇧🇷🇵🇹 Português obrigatório

Outubro 28

Yapp

11 - 50

👥 RH Tech

☁️ SaaS

🤝 B2B

SRE Pleno com foco em AWS para o time técnico da Mytech. Atue com automação, cloud e confiabilidade em um ambiente que adota práticas DevOps e SRE.

🗣️🇧🇷🇵🇹 Português obrigatório

Outubro 28

Yapp

11 - 50

👥 RH Tech

☁️ SaaS

🤝 B2B

Engenheiro(a) Sênior de Site Reliability responsável pela confiabilidade e desempenho de uma plataforma SaaS de alto tráfego. Colaborando com equipes de engenharia em melhores práticas de CI/CD e observabilidade.

🗣️🇧🇷🇵🇹 Português obrigatório

Outubro 28

Yapp

11 - 50

👥 RH Tech

☁️ SaaS

🤝 B2B

Vaga de desenvolvedor na unidade de negócios Concert LAB da YAPP. Envolve trabalho com sistemas de gestão de candidatos e processos de recrutamento.

🗣️🇧🇷🇵🇹 Português obrigatório

Outubro 24

Experian

10001

🤖 Inteligência Artificial

🤝 B2B

☁️ SaaS

Especialista SRE responsável pelo gerenciamento de nuvem e automação para aumentar a produtividade na Serasa Experian no Brasil. Colabora com uma equipe de SREs para garantir operações eficazes e apoiar a tomada de decisões.

🗣️🇧🇷🇵🇹 Português obrigatório

Desenvolvido por Lior Neu-ner. Adoraria receber seu feedback — entre em contato por DM ou pelo e-mail support@remoterocketship.com