Engenheiro de Dados Sênior

201 - 500 funcionários

Fundada em 2010

💼 Consultoria

📣 Marketing

🔌 API

Consulting • Marketing • API

A Leega é uma provedora líder de soluções de tecnologia na América Latina, especializada em analytics de dados e soluções em nuvem. Primeira empresa na região certificada pelo Google Cloud em Data Analytics, a Leega oferece um portfólio de serviços que inclui desenvolvimento de aplicações, machine learning e analytics para gestão de riscos. A empresa faz parcerias com os principais provedores de nuvem, como AWS e Microsoft Azure, para ajudar as empresas a aprimorar a gestão de dados e realizar uma migração eficiente para a nuvem, impulsionando a transformação digital e a inovação.

Engenheiro de Dados Sênior

Vaga não está no LinkedIn

🕒 Junho 10

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Airflow

Apache

JavaScript

Kafka

PySpark

Python

SQL

Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Leega

201 - 500 funcionários

Fundada em 2010

💼 Consultoria

📣 Marketing

🔌 API

Consulting • Marketing • API

Descrição

• Você vai arquitetar e evoluir o datalake que é o sistema nervoso de dados da companhia — a fundação que alimenta, em tempo real, o motor de precificação dinâmica, os modelos de ML e a inteligência comercial do grupo. • É um papel de dono: você define a arquitetura Lakehouse multi-tenant, do streaming à camada semântica, e responde pela sua confiabilidade, governança e custo. • Desenhar e evoluir o data lake em Apache Iceberg sobre S3 — camadas bem definidas, particionamento e compaction, time-travel e suporte a DELETE/UPDATE para a LGPD. • Construir ingestão em tempo real (Kafka, Flink, CDC com Debezium) com evolução de schema controlada (Schema Registry) e garantias de entrega. • Modelar a camada de transformação em dbt e orquestrar fluxos batch e de qualidade em Airflow, do crawler ao backfill. • Manter as definições de métricas em Cube.js — a fonte única que alimenta o BI e os agentes de IA e garante consistência em toda a empresa. • Operar consulta federada e OLAP de baixa latência sobre o lake, com isolamento de custo e acesso por tenant e queries performáticas. • Assegurar testes de dados, lineage e eficiência de custo, mantendo a plataforma confiável à medida que escala.

🎯 Requisitos

• Domínio de SQL e otimização de queries em ambientes distribuídos (Mínimo 5 anos). • Python com experiência sólida em PySpark ou processamento distribuído. • Orquestração (Airflow), ELT e dbt aplicados em larga escala (Mínimo 4 anos). • Streaming (Kafka, Flink) e arquiteturas Lakehouse com Apache Iceberg (Mínimo 3 anos). • Sólida noção de governança, qualidade e modelagem de dados. • Conforto com desenvolvimento assistido por IA (Claude Code). • CDC (Debezium) e OLAP de baixa latência (ClickHouse, Pinot, Trino/Athena). • Semantic Layers (Cube.js, dbt) e arquiteturas Data Mesh. • Governança e catálogo (OpenMetadata, Lake Formation). • Vector databases (Qdrant) e pipelines de dados para ML.

🏖️ Benefícios

• Trabalho Remoto • Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Vagas Similares

Senior Software Engineer - Data Platform

🕒 Junho 9

avra

1 - 10

💼 Consultoria

💸 Finanças

🤝 B2B

Engenheiro(a) de Software Sênior desenvolvendo produtos de dados para a infraestrutura de IA da Avra em um ambiente remote-first. Colaborando com equipes multifuncionais para construir e manter sistemas e serviços de dados.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Cloud

Distributed Systems

Google Cloud Platform

Python

Rust

Especialista de Engenharia de Dados II

🕒 Junho 9

Experian

10.000+ funcionários

💼 Consultoria

📣 Marketing

📦 Logística

Engenheiro(a) de Dados II na Experian projetando e implementando arquiteturas de Data Lake. Colaborando em soluções de IA e ML para gerar insights inovadores orientados por dados em diversos setores.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

🔴 Especialista

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Airflow

Apache

PySpark

Python

Scala

Spark

SQL

Terraform

ESPECIALISTA EM ENGENHARIA DE DADOS | REMOTO

🕒 Junho 8

Localiza&Co

10.000+ funcionários

🚘 Automotivo

📦 Logística

✈️ Turismo

Engenheiro de Dados projetando e implementando pipelines de dados robustos na Localiza&Co. Utilizando ferramentas da AWS para gerir e transformar dados em insights de negócio, contribuindo para a mobilidade sustentável.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Airflow

Apache

AWS

ETL

Python

Spark

SQL

Arquiteto de Dados | Governança de Dados

🕒 Junho 6

Smarthis

51 - 200

💼 Consultoria

📦 Logística

📣 Marketing

Arquiteto de Dados na Smarthis, com foco em definir arquiteturas de dados eficientes e apoiar as equipes de engenharia na implementação. Colaboração em soluções de dados em ambientes cloud.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

AWS

Azure

Cloud

Google Cloud Platform

Engenheiro de Dados SR

🕒 Junho 5

SysMap Solutions

1001 - 5000

💼 Consultoria

📣 Marketing

🤖 Inteligência Artificial

Engenheiro(a) de Dados otimizando consultas SQL complexas para análises em uma empresa de tecnologia em transformação. Atuará na modelagem de dados e construção de pipelines para suportar decisões estratégicas de negócio.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Airflow

BigQuery

Cloud

Google Cloud Platform

SQL