DevOps/Platform Engineer

Job not on LinkedIn

🕒 April 23

🇧🇷 Brazil – Remote

⏰ Full Time

🟡 Mid-level

🟠 Senior

⛑ DevOps & Site Reliability Engineer (SRE)

🗣️🇧🇷🇵🇹 Portuguese Required

Apply Now
Find Similar Remote Jobs

📊 Check your resume score for this job

Improve your chances of getting an interview by checking your resume score before you apply.

Logo of Keep IT Simple

Keep IT Simple

11 - 50 employees

Founded 1988

🔒 Cybersecurity

Cybersecurity • Cloud • Consulting

Keep IT Simple (KIS) is an IT services and solutions provider based in Silicon Valley, serving customers throughout California and beyond since 1988. They specialize in providing expertise in cybersecurity, virtualization, cloud solutions, and consulting for network infrastructures, helping clients navigate and solve complex IT challenges. KIS is dedicated to delivering comprehensive, cost-effective IT solutions and exceptional customer service.

📋 Description

• Projetar, construir e operar a infraestrutura em nuvem, pipelines CI/CD, e plataforma de desenvolvedor que sustentam as iniciativas de inovação digital • Construir e manter a infraestrutura para gerenciamento do ciclo de vida de modelos AI/ML: ambientes de treinamento, serving de modelos, monitoramento de produção • Garantir que a implantação de um modelo de AI em produção seja tão confiável, repetível e observável quanto a implantação de um serviço de software tradicional • Implementar estratégias de implantação: blue/green, canário, atualizações em fase e flags de recursos — para serviços tradicionais e endpoints de modelos de IA • Construir e manter um Stack de observabilidade completo: métricas, registros, traces, e monitoramento específico de IA • Projetar e implementar políticas de segurança como código e gerenciamento de identidade

🎯 Requirements

• 6+ anos de experiência em DevOps, SRE, ou engenharia de plataformas • Experiência em infraestrutura como código: Terraform (primário), com exposição ao Pulumi, CloudFormation, ou Bicep • Experiência com Kubernetes (EKS, AKS, ou GKE): gerenciamento de clusters, Helm charts, operadores, autoescalonamento e solução de problemas • Experiência profunda com design de pipelines CI/CD: GitHub Actions, GitLab CI, Azure DevOps Pipelines, ou Jenkins — incluindo pipelines de múltiplas etapas com portões de qualidade automatizados • Forte experiência em infraestrutura de nuvem em pelo menos dois: AWS, Azure, GCP — com habilidades práticas em rede, computação, armazenamento, identidade e serviços de segurança • Proficiência em scripting e automação: Python, Bash, PowerShell, e pelo menos um dos: Go, TypeScript • Experiência na construção de pilhas de observabilidade: Prometheus, Grafana, Datadog, ELK, OpenTelemetry, e sistemas de alerta/atendimento (PagerDuty, Opsgenie) • Forte compreensão de engenharia de segurança: gerenciamento de segredos, segurança de rede, IAM, segurança de contêineres, e automação de conformidade • Experiência com práticas e ferramentas GitOps: ArgoCD, Flux, ou equivalente • Inglês fluente, tanto escrito quanto falado • Experiência comprovada em projetos internacionais, incluindo colaboração com equipes globais e multiculturais • Habilidades de comunicação, gerenciamento de partes interessadas, e resolução de problemas • Experiência prévia mentorando engenheiros ou atuando como líder técnico é fortemente preferível. • Experiência prática em MLOps: serving de modelos, gerenciamento de infraestrutura de GPU, e conhecimento de ferramentas de engenharia de caos como Chaos Monkey • Bacharelado em Ciência da Computação, Sistemas de Informação, Engenharia, ou campo relacionado é preferido.

🏖️ Benefits

• 100% Remoto

Apply Now

Similar Jobs

🕒 April 22

Jusbrasil

201 - 500

SRE Partner enabling internal Product Areas with reliability engineering solutions. Focus on automating and improving system reliability through collaboration and data-driven practices.

🇧🇷 Brazil – Remote

⏰ Full Time

🟡 Mid-level

🟠 Senior

⛑ DevOps & Site Reliability Engineer (SRE)

🗣️🇧🇷🇵🇹 Portuguese Required

🕒 April 20

CI&T

5001 - 10000

🤖 Artificial Intelligence

☁️ SaaS

Senior DevOps/SRE focusing on Internal Developer Platform development for AI. Building self-service tools and improving developer experience with cloud infrastructure management.

🇧🇷 Brazil – Remote

💰 $5.5M Venture Round on 2014-04

⏰ Full Time

🟠 Senior

⛑ DevOps & Site Reliability Engineer (SRE)

🗣️🇧🇷🇵🇹 Portuguese Required

🕒 April 17

Verity Group

51 - 200

🤖 Artificial Intelligence

🤝 B2B

☁️ SaaS

SRE / DevOps Engineer supporting high-criticality environments and cloud-native platforms. Collaborating with squads for reliable software delivery.

🇧🇷 Brazil – Remote

⏰ Full Time

🟡 Mid-level

🟠 Senior

⛑ DevOps & Site Reliability Engineer (SRE)

🗣️🇧🇷🇵🇹 Portuguese Required

🕒 April 16

Lanlink Informática Ltda.

501 - 1000

🔒 Cybersecurity

🤖 Artificial Intelligence

Analyzing and supporting operational services in critical corporate environments. Focused on DevOps practices and automation using modern tools and technologies.

🗣️🇧🇷🇵🇹 Portuguese Required

🕒 April 16

EY

10,000+ employees

💸 Finance

Site Reliability Engineer managing cloud infrastructure for a global financial technology client. Designing, implementing, and maintaining reliable cloud-based systems.

🗣️🇧🇷🇵🇹 Portuguese Required