Engenheiro de Dados Sênior

Job not on LinkedIn

🔥 0 minutes ago

🗣️🇧🇷🇵🇹 Portuguese Required

Apply Now
Find Similar Remote Jobs

📊 Check your resume score for this job

Improve your chances of getting an interview by checking your resume score before you apply.

Logo of GFT Technologies

GFT Technologies

10,000+ employees

Founded 1987

🔒 Cybersecurity

📋 Compliance

☁️ SaaS

Cybersecurity • Compliance • SaaS

GFT Technologies is a leading technology and digital transformation company that specializes in providing advanced solutions for consent management and data privacy compliance. Their flagship product, Cookiebot, enables businesses to automate user consent collection efficiently, ensuring adherence to complex privacy regulations such as GDPR and CCPA. GFT's solutions facilitate seamless integration into existing digital infrastructures, helping over 600,000 customers globally manage user data transparently and securely.

📋 Description

• Atuar na manutenção e evolução de pipelines ETL multiestágio em diferentes domínios de dados; • Implementar transformações de dados, como conversões, filtragem de outliers, preenchimento de lacunas, suavização e interpolação; • Diagnosticar e corrigir problemas de qualidade de dados em pipelines produtivos; • Projetar e manter configurações de mapeamento de campos baseadas em YAML para novas fontes de dados; • Consultar e carregar dados utilizando Cloud SQL e BigQuery; • Construir e manter endpoints utilizando FastAPI seguindo princípios de arquitetura limpa; • Desenvolver testes unitários e de integração utilizando pytest; • Colaborar em revisões de código e manutenção de pipelines de CI/CD no Azure DevOps; • Trabalhar diretamente com dados brutos e pipelines produtivos, garantindo eficiência e confiabilidade; • Traduzir regras de negócio em transformações eficientes utilizando pandas;

🎯 Requirements

• Inglês avançado para comunicação diária com times internacionais; • Experiência sólida com Python (versão 3.10 ou superior); • Domínio de dataclasses, type hints e abstract base classes; • Experiência com pandas e NumPy para processamento de dados em larga escala; • Experiência com scipy para otimização e ajuste de curvas; • Experiência com SQLAlchemy (Core e ORM); • Vivência na construção de APIs assíncronas utilizando FastAPI e asyncio; • Experiência com Cloud SQL e autenticação via IAM no GCP; • Experiência com BigQuery para consulta e carga de dados; • Experiência com Cloud Storage para manipulação de arquivos; • Conhecimento em service accounts e controle de acesso (IAM); • Experiência no design e debugging de pipelines de dados multiestágio; • Forte entendimento de processamento de dados sequenciais ou séries temporais; • Experiência com validação de dados, deduplicação e imputação; • Experiência com pipelines orientados a configuração (YAML); • Experiência com Docker e Docker Compose; • Experiência com pipelines de CI/CD (preferencialmente Azure DevOps); • Experiência com gerenciamento de dependências utilizando Poetry; • Conhecimento básico de Redis como camada de cache; • Capacidade de comunicação clara de decisões técnicas e atuação colaborativa com times multidisciplinares;

🏖️ Benefits

• Cartão multi-benefícios – você escolhe como e onde utilizar. • Bolsas de Estudos para cursos de Graduação, Pós, MBA e Idiomas. • Programas de incentivo à Certificações. • Horário de trabalho flexível. • Salários competitivos. • Avaliação de desempenho anual com plano de carreira estruturado. • Possibilidade de carreira internacional. • Wellhub e TotalPass. • Previdência Privada. • Auxílio-Creche. • Assistência Médica. • Assistência Odontológica. • Seguro de Vida.

Apply Now

Similar Jobs

🔥 1 hour ago

Stefanini Brasil

10,000+ employees

🤖 Artificial Intelligence

🔒 Cybersecurity

Data Engineer building and maintaining data pipelines on Google Cloud Platform. Ensuring data quality and governance while collaborating with business and technology teams.

🗣️🇧🇷🇵🇹 Portuguese Required

BigQuery

Cloud

ETL

Google Cloud Platform

🔥 1 hour ago

phData

201 - 500

🤖 Artificial Intelligence

☁️ SaaS

🏢 Enterprise

Senior Data Engineer delivering services and solutions in modern data stack for phData. Collaborating with major cloud data platforms to foster a community of technological curiosity and trust.

AWS

Azure

Cloud

Google Cloud Platform

Java

Python

Scala

SQL

🔥 4 hours ago

Niche

201 - 500

📚 Education

🏪 Marketplace

🤝 Non-profit

Senior Data Engineer building and supporting data pipelines for Niche, a school search leader. Focusing on projects in Brazil and Argentina only, with remote work options.

Airflow

Docker

Kafka

Kubernetes

Postgres

Python

SQL

Vault

🕒 Yesterday

Leega

201 - 500

🔌 API

🤖 Artificial Intelligence

Architect and evolve the datalake system for dynamic pricing and machine learning at Leega. Ensure data governance, quality, and responsiveness in a multi-tenant Lakehouse architecture.

🗣️🇧🇷🇵🇹 Portuguese Required

Airflow

Apache

JavaScript

Kafka

PySpark

Python

SQL

🕒 Yesterday

Experian

10,000+ employees

🤖 Artificial Intelligence

🤝 B2B

☁️ SaaS

Junior Data Engineering Analyst at Experian supporting AI solution development and automation in various sectors. Collaborating with experienced professionals to build scalable platforms.

🗣️🇧🇷🇵🇹 Portuguese Required

AWS

Cloud

Docker

NoSQL

Pandas

Python

PyTorch

Scikit-Learn

Spark

SQL

Tensorflow