Engenheiro de Dados Pleno GCP/DBT

201 - 500 funcionários

Fundada em 2010

🔌 API

🤖 Inteligência Artificial

API • Artificial Intelligence • Cloud Solutions

A Leega é uma provedora líder de soluções de tecnologia na América Latina, especializada em analytics de dados e soluções em nuvem. Primeira empresa na região certificada pelo Google Cloud em Data Analytics, a Leega oferece um portfólio de serviços que inclui desenvolvimento de aplicações, machine learning e analytics para gestão de riscos. A empresa faz parcerias com os principais provedores de nuvem, como AWS e Microsoft Azure, para ajudar as empresas a aprimorar a gestão de dados e realizar uma migração eficiente para a nuvem, impulsionando a transformação digital e a inovação.

Engenheiro de Dados Pleno GCP/DBT

Vaga não está no LinkedIn

🕒 Junho 24

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

BigQuery

Cloud

ETL

Google Cloud Platform

Hadoop

PySpark

Python

Shell Scripting

Spark

SQL

Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Leega

201 - 500 funcionários

Fundada em 2010

🔌 API

🤖 Inteligência Artificial

API • Artificial Intelligence • Cloud Solutions

Descrição

• Análise e Planejamento de Cargas/Pipelines: • Avaliar a arquitetura e os requisitos do DW. • Mapear os dados, transformações e processos os serviços GCP (Cloud Storage, BigQuery, Dataproc). • Definir a estratégia de migração de dados (full load, incremental, CDC). • Elaborar um plano de arquitetura de dados no GCP. • Design e Modelagem de Dados no GCP: • Projetar esquemas de tabelas no BigQuery, considerando performance, custo e escalabilidade. • Definir estratégias de particionamento e clustering para BigQuery. • Modelar as zonas de dados no Cloud Storage (Bronze, Silver e Gold). • Desenvolvimento de Pipelines de ELT/ETL: • Criar rotinas de transformação de dados usando Dataproc (Spark) ou Dataflow para carregar dados para o BigQuery. • Traduzir a lógica de negócios e as transformações existentes no GCP. • Implementar mecanismos de validação e qualidade de dados. • Otimização de Performance e Custo: • Otimizar consultas no BigQuery para reduzir custos e melhorar o desempenho. • Ajustar e otimizar jobs Spark no Dataproc. • Monitorar e otimizar o uso de recursos GCP para controlar custos. • Segurança e Governança de Dados: • Implementar e garantir a segurança dos dados em trânsito e em repouso. • Definir e aplicar políticas de IAM para controlar o acesso aos dados e recursos. • Garantir a conformidade com as políticas de governança de dados. • Monitoramento e Suporte: • Solucionar problemas de desempenho e funcionalidade dos pipelines de dados e recursos GCP. • Documentação: • Documentar a arquitetura, os pipelines de dados, os modelos de dados e os procedimentos operacionais. • Comunicação: • Comunicar-se de forma eficaz com membros da equipe, stakeholders e outras áreas da empresa. • Garantir a comunicação clara entre as definições de arquitetura e componentes de software, evolução e a qualidade dos desenvolvimentos da equipe; • Jira / Metodologias Ágeis: • Conhecer as metodologias ágeis, seus ritos e proficiência com a ferramenta Jira.

🎯 Requisitos

• Conhecimento comprovado em DBT no minimo de 3 anos; • Domínio de: • models (staging, intermediate, marts) • ref() e source() • macros (Jinja) • seeds e snapshots • tests (not null, unique, custom) • Organização em camadas: • Staging → Transform → Mart (Data Warehouse • **Google Cloud Platform (GCP):** • **BigQuery:** Profundo conhecimento em modelagem de dados, otimização de consultas, particionamento, clustering, carga de dados (streaming e batch), segurança e governança de dados. • **Cloud Storage:** Experiência em gerenciamento de buckets, classes de armazenamento, políticas de ciclo de vida, controle de acesso (IAM) e segurança de dados. • **Dataproc:** Habilidade em provisionamento, configuração e gerenciamento de clusters Spark/Hadoop, otimização de jobs, e integração com outros serviços GCP. • **Dataflow/Composer/DBT:** Conhecimento em ferramentas de orquestração e processamento de dados para pipelines ELT/ETL. • **Cloud IAM (Identity and Access Management):** Implementação de políticas de segurança e controle de acesso granular. • **VPC, Networking e Security:** Entendimento de redes, sub-redes, regras de firewall e melhores práticas de segurança na nuvem. • **Linguagens de Programação:** • **Python e PySpark:** Essencial para scripts de automação, desenvolvimento de pipelines de dados e integração com APIs GCP. • **SQL (avançado):** Para BigQuery, DBT e transformações de dados. • **Shell Scripting:** Para automação de tarefas. • **Controle de Versão:** • Git/GitHub/Bitbucket.

🏖️ Benefícios

• 🏥 Convênio Médico Porto Seguro • 🦷 Convênio Odontológico Porto Seguro • 💰 Participação nos Lucros e Resultados (PLR) • 👶 Auxílio Creche • 🍽️ Vale Alimentação e Refeição Alelo • 💻 Auxílio Home Office • 📚 Parcerias com Instituições de Ensino • 🚀 Incentivo para Certificações, inclusive em Cloud • 🎁 Pontos Livelo • 🏋️‍♂️ TotalPass • 🧘‍♂️Mindself

Vagas Similares

Engenharia de Dados Sênior - 134263

🕒 Junho 23

GFT Technologies

10.000+ funcionários

🔒 Cibersegurança

📋 Conformidade

☁️ SaaS

Engenheiro de Dados Sênior projetando soluções escaláveis e confiáveis de ingestão e transformação de dados. Colaboração com equipes de BI, gestão de pipelines em ambientes de Data Lake e utilização de integração com SAP.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Azure

Python

Spark

SQL

Arquiteto de Dados AWS

🕒 Junho 23

Stefanini Brasil

10.000+ funcionários

🤖 Inteligência Artificial

🔒 Cibersegurança

Arquiteto de Dados projetando e gerenciando soluções de dados em AWS para a Stefanini. Foco em soluções Lakehouse com Databricks.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório

🗣️🇧🇷🇵🇹 Português obrigatório

Apache

AWS

ETL

PySpark

Spark

SQL

Unity

[JOB-29985] Data Engineer Senior (FICO)

🕒 Junho 22

CI&T

5001 - 10000

🤖 Inteligência Artificial

☁️ SaaS

Engenheiro(a) de Dados na CI&T transformando IA em soluções de negócio impactantes. Foco em pipelines de dados, qualidade dos dados e colaboração com equipes para soluções escaláveis.

🇧🇷 Brasil – Remoto

💰 $5.500.000 Venture Round em 2014-04

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Azure

Cloud

ETL

HDFS

PySpark

Python

Spark

SQL

Engenheiro(a) de Dados

🕒 Junho 22

Oscilar

51 - 200

💳 Fintech

🏦 Bancário

📋 Conformidade

Engenheiro(a) de Dados projetando pipelines ETL entre múltiplas fontes cloud-native para análise em tempo real e gestão de riscos. Colabore com times para proteger contra fraudes online no setor bancário.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório

Airflow

Cloud

ETL

Java

Kafka

Postgres

Python

SQL

[Job-29669] Senior Data Engineer & Analytics , Brasil

🕒 Junho 22

CI&T

5001 - 10000

🤖 Inteligência Artificial

☁️ SaaS

Engenheiro de Dados responsável por construir e evoluir a arquitetura de dados que apoia iniciativas de transformação digital. Colabora no desenvolvimento de soluções escaláveis, confiáveis e orientadas por dados.

🇧🇷 Brasil – Remoto

💰 $5.500.000 Venture Round em 2014-04

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Azure

SQL