Engenheiro de Dados Sênior GCP/DBT

Vaga não está no LinkedIn

🔥 0 minutos atrás

🗣️🇧🇷🇵🇹 Português obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Leega

Leega

201 - 500 funcionários

Fundada em 2010

🔌 API

🤖 Inteligência Artificial

API • Artificial Intelligence • Cloud Solutions

A Leega é uma provedora líder de soluções de tecnologia na América Latina, especializada em analytics de dados e soluções em nuvem. Primeira empresa na região certificada pelo Google Cloud em Data Analytics, a Leega oferece um portfólio de serviços que inclui desenvolvimento de aplicações, machine learning e analytics para gestão de riscos. A empresa faz parcerias com os principais provedores de nuvem, como AWS e Microsoft Azure, para ajudar as empresas a aprimorar a gestão de dados e realizar uma migração eficiente para a nuvem, impulsionando a transformação digital e a inovação.

Descrição

• **Análise e Planejamento de Cargas/Pipelines:** • Avaliar a arquitetura e os requisitos do DW. • **Mapear os dados, transformações e processos os serviços GCP (Cloud Storage, BigQuery, Dataproc).** • Definir a estratégia de migração de dados (full load, incremental, CDC). • Elaborar um plano de arquitetura de dados no GCP. • **Design e Modelagem de Dados no GCP:** • Projetar esquemas de tabelas no BigQuery, considerando performance, custo e escalabilidade. • Definir estratégias de particionamento e clustering para BigQuery. • Modelar as zonas de dados no Cloud Storage (Bronze, Silver e Gold). • **Desenvolvimento de Pipelines de ELT/ETL:** • Criar rotinas de transformação de dados usando Dataproc (Spark) ou Dataflow para carregar dados para o BigQuery. • Traduzir a lógica de negócios e as transformações existentes no GCP. • Implementar mecanismos de validação e qualidade de dados. • **Provisionamento e Gerenciamento de Infraestrutura:** • Utilizar ferramentas de IaC (Terraform) para provisionar e gerenciar recursos GCP (BigQuery datasets/tables, Cloud Storage buckets, Dataproc clusters). • Configurar e otimizar clusters Dataproc para diferentes cargas de trabalho. • Gerenciar redes, segurança (IAM) e acessos no GCP. • **Otimização de Performance e Custo:** • Otimizar consultas no BigQuery para reduzir custos e melhorar o desempenho. • Ajustar e otimizar jobs Spark no Dataproc. • Monitorar e otimizar o uso de recursos GCP para controlar custos. • **Segurança e Governança de Dados:** • Implementar e garantir a segurança dos dados em trânsito e em repouso. • Definir e aplicar políticas de IAM para controlar o acesso aos dados e recursos. • Garantir a conformidade com as políticas de governança de dados. • **Monitoramento e Suporte:** • Solucionar problemas de desempenho e funcionalidade dos pipelines de dados e recursos GCP. • **Documentação:** • Documentar a arquitetura, os pipelines de dados, os modelos de dados e os procedimentos operacionais. • **Comunicação:** • Comunicar-se de forma eficaz com membros da equipe, stakeholders e outras áreas da empresa. • Garantir a comunicação clara entre as definições de arquitetura e componentes de software, evolução e a qualidade dos desenvolvimentos da equipe; • **Jira / Metodologias Ágeis:** • Conhecer as metodologias ágeis, seus ritos e proficiência com a ferramenta Jira.

🎯 Requisitos

• **Google Cloud Platform (GCP):** • **BigQuery:** Profundo conhecimento em modelagem de dados, otimização de consultas, particionamento, clustering, carga de dados (streaming e batch), segurança e governança de dados. • **Cloud Storage:** Experiência em gerenciamento de buckets, classes de armazenamento, políticas de ciclo de vida, controle de acesso (IAM) e segurança de dados. • **Dataproc:** Habilidade em provisionamento, configuração e gerenciamento de clusters Spark/Hadoop, otimização de jobs, e integração com outros serviços GCP. • **Dataflow/Composer/DBT:** Conhecimento em ferramentas de orquestração e processamento de dados para pipelines ELT/ETL. • **Conhecimento comprovado no mínimo 3 anos em GCP;** • **Conhecimento comprovado no mínimo 3 anos em DBT e se possível ;** • Conhecimento comprovado no minimo 3 anos em Pyspark; • Conhecimento comprovado em GitFlow; • **Cloud IAM (Identity and Access Management):** Implementação de políticas de segurança e controle de acesso granular. • **VPC, Networking e Security:** Entendimento de redes, sub-redes, regras de firewall e melhores práticas de segurança na nuvem. • **Linguagens de Programação:** • **Python e PySpark:** Essencial para scripts de automação, desenvolvimento de pipelines de dados e integração com APIs GCP. • **SQL (avançado):** Para BigQuery, DBT e transformações de dados. • **Shell Scripting:** Para automação de tarefas. • **Controle de Versão:** • Git/GitHub/Bitbucket.

🏖️ Benefícios

• 🏥 Convênio Médico Porto Seguro • 🦷 Convênio Odontológico Porto Seguro • 💰 Participação nos Lucros e Resultados (PLR) • 👶 Auxílio Creche • 🍽️ Vale Alimentação e Refeição Alelo • 💻 Auxílio Home Office • 📚 Parcerias com Instituições de Ensino • 🚀 Incentivo para Certificações, inclusive em Cloud • 🎁 Pontos Livelo • 🏋️‍♂️ TotalPass • 🧘‍♂️Mindself

Candidatar-se

Vagas Similares

🔥 8 horas atrás

Zup Innovation

1001 - 5000

Líder de Engenharia de Dados projetando e implementando sistemas de dados seguros para a Zup Innovation. Liderando ingestão, processamento e governança de dados entre ambientes cloud e on‑premises.

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 3 dias atrás

Runtalent

501 - 1000

🤝 B2B

👥 RH Tech

☁️ SaaS

Consultor de Migração de Dados SAP com foco em projetos de migração nos módulos SAP FI e MM. Oportunidade remota que exige conhecimento avançado e experiência em migração de dados SAP.

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 3 dias atrás

Rox Partner

51 - 200

🔒 Cibersegurança

🤖 Inteligência Artificial

🏢 Corporativo

Engenheiro de Dados Sênior para consultoria de dados focado em GCP, monitoramento de pipelines de dados e resolução de incidentes. Colaboração com equipes de engenharia de dados e governança para aprimorar sistemas de dados.

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 4 dias atrás

Compass

10.000+ funcionários

🏠 Imobiliário

📱 Mídia

Engenheiro de Dados Alteryx responsável por migrar workflows para a AWS e otimizar pipelines de dados na nuvem. Desenvolvido pela Compass UOL, com foco em inteligência artificial e tecnologias avançadas.

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 5 dias atrás

Truelogic Software

501 - 1000

☁️ SaaS

🤝 B2B

🏢 Corporativo

Engenheiro(a) de Dados Sênior conduzindo a arquitetura da plataforma de dados empresarial para um marketplace atacadista B2B líder em um setor com forte exigência de conformidade.

🗣️🇺🇸🇬🇧 Inglês obrigatório