Engenheiro(a) de Dados Sênior/Lead – Plataforma Aftermarket Nativa de IA | Brasil

501 - 1000 funcionários

Fundada em 2004

☁️ SaaS

🤝 B2B

🏢 Corporativo

SaaS • B2B • Enterprise

Truelogic Software é uma empresa de desenvolvimento de software nearshore especializada em serviços de staff augmentation ágil. Focamos em oferecer desenvolvimento de software sob medida terceirizado, com uma equipe de engenheiros altamente qualificados da América Latina. A Truelogic Software faz parceria tanto com startups quanto com empresas da Fortune 500, oferecendo soluções alinhadas aos fusos horários de seus clientes e garantindo resultados de alta qualidade por meio de colaboração e agilidade na resposta. Com presença em mais de 25 países, a Truelogic valoriza o trabalho remoto para uma melhor qualidade de vida, e seus engenheiros têm experiência em diversos setores, entregando uma ampla variedade de projetos bem-sucedidos globalmente.

Engenheiro(a) de Dados Sênior/Lead – Plataforma Aftermarket Nativa de IA | Brasil

🔥 0 minutos atrás

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇺🇸🇬🇧 Inglês obrigatório

Azure

PySpark

Python

Spark

SQL

Unity

Vault

Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Truelogic Software

501 - 1000 funcionários

Fundada em 2004

☁️ SaaS

🤝 B2B

🏢 Corporativo

SaaS • B2B • Enterprise

Descrição

• Projetar e construir pipelines de dados robustos e idempotentes do zero, utilizando uma stack de dados moderna. • Projetar esquemas star e snowflake, escrevendo SQL preciso e sensível à granularidade (grain) para construir data marts escaláveis. • Escrever código Python de nível de produção, testado por unidades a nível de módulo, seguindo disciplinas de engenharia rigorosas como anotações de tipo (type hints) e testes. • Construir e testar modelos dbt nas camadas de staging, intermediate e mart, gerenciando a estrutura geral do projeto. • Criar e implantar jobs usando Databricks Asset Bundles (DAB) seguindo padrões arquiteturais documentados. • Implementar verificações rigorosas de qualidade de dados nas camadas de origem, intermediária e destino para evitar perda silenciosa de nulos ou duplicatas. • Manter governança de dados por meio de testes dbt abrangentes e disciplina rigorosa de documentação no momento do merge. • Operar de forma segura em uma arquitetura multi-repositório, utilizando service principals e garantindo zero credenciais pessoais em deployments de produção. • Executar verificações de exposição entre repositórios antes de mesclar mudanças que quebrem o schema. • Ser responsável pelas pipelines de dados de ponta a ponta, tomando decisões técnicas-chave de design e mentorando engenheiros de nível médio por meio de revisões de código substantivas. • Definir a direção técnica geral dos sistemas de dados centrais, incluindo padrões de modelagem, estratégias de branching, thresholds de observabilidade e políticas de gerenciamento de segredos. • Atuar como líder técnico para remover impedimentos da equipe e participar ativamente de painéis de contratação para escalar a organização de engenharia.

🎯 Requisitos

• Expertise em SQL e metodologias de modelagem dimensional, incluindo medallion architecture, SCDs (Slowly Changing Dimensions) e gerenciamento de granularidade (grain). • Capacidade comprovada de projetar pipelines idempotentes utilizando estratégias incremental, checkpoint e replaceWhere. • Experiência extensa com engenharia Python de nível de produção, incluindo anotações de tipo (type hints), pytest e ruff. • Forte habilidade para diagnosticar e resolver jobs Spark/PySpark com ferramentas como Spark UI. • Entendimento profundo das funcionalidades do Delta Lake, como MERGE, OPTIMIZE, Z-ORDER e time travel. • Experiência prática com dbt, incluindo models, tests e exposures. • Experiência em criar e implantar jobs usando Databricks Asset Bundles (DAB) e operar em um ambiente com Unity Catalog. • Compromisso com a qualidade de dados via asserts pré-escrita, checagens de schema e manutenção de testes dbt de relacionamento e unicidade. • Forte adesão a workflows disciplinados de Git, conventional commits e práticas rígidas de documentação. • Experiência em provisionar e utilizar Service Principals, GitHub environment secrets e ferramentas de gerenciamento de segredos como Azure Key Vault ou Databricks secret scopes. • Fortes habilidades de comunicação técnica escrita para descrições de PR e runbooks, com capacidade de traduzir o trabalho das pipelines em métricas de negócio. • Habilidade comprovada de tomada de decisão para navegar em ambiguidade e equilibrar trade-offs entre custo, latência e confiabilidade. • Experiência em liderar iniciativas técnicas, estabelecer padrões arquiteturais e contribuir com rubricas de entrevista é preferencial. • Experiência em ler ou modificar pipelines do Azure Data Factory (ADF) e familiaridade com Azure Data Lake Storage é altamente preferencial. • Familiaridade com ferramentas de observabilidade do dbt, como Elementary, é um diferencial. • Conhecimento sobre melhores práticas de detecção e mascaramento de PII é preferencial. • Experiência com padrões de configuração multi-tenant para onboarding de novos tenants sem mudanças de código é um grande diferencial. • Proficiência em ler e editar workflows do GitHub Actions para deploy em Databricks é preferencial. • Capacidade de tomar decisões de computação conscientes de custos, selecionando o formato de cluster adequado para cada workload, é um diferencial. • Proficiência em ferramentas de desenvolvimento assistido por IA, como Claude Code, para trabalho diário e revisão de código é preferencial. • Experiência em redigir post-mortems de incidentes e coordenar handovers de features com times de Data Science é um diferencial.

🏖️ Benefícios

• 100% Remoto: Aproveite a liberdade de trabalhar de onde você render melhor. Tudo o que é necessário é um laptop e uma conexão de internet confiável. • Remuneração altamente competitiva em USD: Receba uma compensação excelente, em dólares, superior ao típico oferecido no mercado. • Tempo livre remunerado: Valorizamos seu bem-estar. Nossas políticas de folga remunerada garantem que você tenha oportunidades para descansar e recarregar quando necessário. • Trabalho com autonomia: Tenha liberdade para gerir seu tempo desde que os resultados sejam entregues. Foco em resultados, não em horas. • Trabalhe com empresas americanas de ponta: Amplie sua experiência atuando em projetos inovadores e de alto impacto com empresas líderes dos EUA.

Vagas Similares

Engenheiro de Dados Pleno GCP/DBT

🔥 6 horas atrás

Leega

201 - 500

🔌 API

🤖 Inteligência Artificial

Engenheiro de Dados gerenciando ambientes GCP e DBT na Leega. Foco em arquitetura de dados, desenvolvimento de pipelines e otimização de desempenho em serviços cloud.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

BigQuery

Cloud

ETL

Google Cloud Platform

Hadoop

PySpark

Python

Shell Scripting

Spark

SQL

Data Engineer Sênior - REMOTO

🔥 21 horas atrás

Verity Group

51 - 200

🤖 Inteligência Artificial

🤝 B2B

☁️ SaaS

Engenheiro de Dados responsável por compreender, transformar e validar modelos de dados legados na Verity. Envolve o mapeamento de entidades e a execução de processos de extração de dados.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

BigQuery

Cloud

Google Cloud Platform

SQL

Data Engineer | specialist (Remote)

🕒 Ontem

Compass

10.000+ funcionários

🏠 Imobiliário

📱 Mídia

Engenheiro de Dados especializado em IA para modernização de dados e otimização de sistemas. Junte-se à Compass UOL para desenvolver soluções de dados de próxima geração e resultados orientados por IA.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

PySpark

Python

Spark

SQL

Engenheiro de Dados

🕒 Ontem

FCamara Consulting & Training

1001 - 5000

🛍️ Comércio Eletrônico

🤖 Inteligência Artificial

Engenheiro(a) de Dados focado em IA, construindo infraestrutura confiável e escalável para aplicações de Machine Learning e Inteligência Generativa. Garantindo a qualidade dos dados e possibilitando pipelines de processamento de dados eficientes.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Airflow

Amazon Redshift

Apache

AWS

Azure

BigQuery

Cloud

Docker

Google Cloud Platform

Kafka

Kubernetes

NoSQL

Pandas

PySpark

Python

Scala

Spark

SQL

Data Engineer (Databricks & Azure) | Senior (Remote)

🕒 Ontem

Compass

10.000+ funcionários

🏠 Imobiliário

📱 Mídia

Engenheiro de Dados atuando remotamente para estruturar e manter plataformas analíticas com Databricks e Azure. Implementa e gerencia ambientes, garantindo qualidade dos dados e governança.

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Azure

Cloud

ETL

SQL

Unity