Engenheiro de Dados Sênior

Vaga não está no LinkedIn

🔥 0 minutos atrás

🗣️🇧🇷🇵🇹 Português obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Leega

Leega

201 - 500 funcionários

Fundada em 2010

🔌 API

🤖 Inteligência Artificial

API • Artificial Intelligence • Cloud Solutions

A Leega é uma provedora líder de soluções de tecnologia na América Latina, especializada em analytics de dados e soluções em nuvem. Primeira empresa na região certificada pelo Google Cloud em Data Analytics, a Leega oferece um portfólio de serviços que inclui desenvolvimento de aplicações, machine learning e analytics para gestão de riscos. A empresa faz parcerias com os principais provedores de nuvem, como AWS e Microsoft Azure, para ajudar as empresas a aprimorar a gestão de dados e realizar uma migração eficiente para a nuvem, impulsionando a transformação digital e a inovação.

Descrição

• Você vai arquitetar e evoluir o datalake que é o sistema nervoso de dados da companhia — a fundação que alimenta, em tempo real, o motor de precificação dinâmica, os modelos de ML e a inteligência comercial do grupo. • É um papel de dono: você define a arquitetura Lakehouse multi-tenant, do streaming à camada semântica, e responde pela sua confiabilidade, governança e custo. • Desenhar e evoluir o data lake em Apache Iceberg sobre S3 — camadas bem definidas, particionamento e compaction, time-travel e suporte a DELETE/UPDATE para a LGPD. • Construir ingestão em tempo real (Kafka, Flink, CDC com Debezium) com evolução de schema controlada (Schema Registry) e garantias de entrega. • Modelar a camada de transformação em dbt e orquestrar fluxos batch e de qualidade em Airflow, do crawler ao backfill. • Manter as definições de métricas em Cube.js — a fonte única que alimenta o BI e os agentes de IA e garante consistência em toda a empresa. • Operar consulta federada e OLAP de baixa latência sobre o lake, com isolamento de custo e acesso por tenant e queries performáticas. • Assegurar testes de dados, lineage e eficiência de custo, mantendo a plataforma confiável à medida que escala.

🎯 Requisitos

• Domínio de SQL e otimização de queries em ambientes distribuídos (Mínimo 5 anos). • Python com experiência sólida em PySpark ou processamento distribuído. • Orquestração (Airflow), ELT e dbt aplicados em larga escala (Mínimo 4 anos). • Streaming (Kafka, Flink) e arquiteturas Lakehouse com Apache Iceberg (Mínimo 3 anos). • Sólida noção de governança, qualidade e modelagem de dados. • Conforto com desenvolvimento assistido por IA (Claude Code). • CDC (Debezium) e OLAP de baixa latência (ClickHouse, Pinot, Trino/Athena). • Semantic Layers (Cube.js, dbt) e arquiteturas Data Mesh. • Governança e catálogo (OpenMetadata, Lake Formation). • Vector databases (Qdrant) e pipelines de dados para ML.

🏖️ Benefícios

• Trabalho Remoto • Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Candidatar-se

Vagas Similares

🔥 13 horas atrás

Experian

10.000+ funcionários

🤖 Inteligência Artificial

🤝 B2B

☁️ SaaS

Analista Júnior de Engenharia de Dados na Experian apoiando o desenvolvimento de soluções de IA e automação em diversos setores. Colabora com profissionais experientes para construir plataformas escaláveis.

🗣️🇧🇷🇵🇹 Português obrigatório

🔥 16 horas atrás

INDT - Instituto de Desenvolvimento Tecnológico

201 - 500

🧬 Biotecnologia

🔒 Cibersegurança

📡 Telecomunicações

Engenheiro de Dados que apoia a equipe de analytics de clientes com ingestão de dados e manutenção de pipelines. Envolve integração de sistemas legados e desenvolvimento utilizando Databricks.

🗣️🇧🇷🇵🇹 Português obrigatório

🔥 16 horas atrás

Reply

10.000+ funcionários

Engenheiro(a) de Dados na Reply especializado(a) em modelagem e manutenção de soluções de dados no Palantir. Colaboração em projetos orientados por IA e garantia de governança e qualidade de dados.

🗣️🇧🇷🇵🇹 Português obrigatório

🗣️🇺🇸🇬🇧 Inglês obrigatório

🔥 21 horas atrás

avra

1 - 10

Engenheiro(a) de Software Sênior desenvolvendo produtos de dados para a infraestrutura de IA da Avra em um ambiente remote-first. Colaborando com equipes multifuncionais para construir e manter sistemas e serviços de dados.

🗣️🇧🇷🇵🇹 Português obrigatório

🕒 Ontem

Experian

10.000+ funcionários

🤖 Inteligência Artificial

🤝 B2B

☁️ SaaS

Engenheiro(a) de Dados II na Experian projetando e implementando arquiteturas de Data Lake. Colaborando em soluções de IA e ML para gerar insights inovadores orientados por dados em diversos setores.

🗣️🇧🇷🇵🇹 Português obrigatório