Data Engineer

🕒 5 days ago

🗣️🇧🇷🇵🇹 Portuguese Required

Apply Now
Find Similar Remote Jobs

📊 Check your resume score for this job

Improve your chances of getting an interview by checking your resume score before you apply.

Logo of GFT Technologies

GFT Technologies

10,000+ employees

Founded 1987

🔒 Cybersecurity

📋 Compliance

☁️ SaaS

Cybersecurity • Compliance • SaaS

GFT Technologies is a leading technology and digital transformation company that specializes in providing advanced solutions for consent management and data privacy compliance. Their flagship product, Cookiebot, enables businesses to automate user consent collection efficiently, ensuring adherence to complex privacy regulations such as GDPR and CCPA. GFT's solutions facilitate seamless integration into existing digital infrastructures, helping over 600,000 customers globally manage user data transparently and securely.

📋 Description

• Atuar na manutenção e evolução de pipelines ETL multiestágio em diferentes domínios de dados; • Implementar transformações de dados, como conversões, filtragem de outliers, preenchimento de lacunas, suavização e interpolação; • Diagnosticar e corrigir problemas de qualidade de dados em pipelines produtivos; • Projetar e manter configurações de mapeamento de campos baseadas em YAML para novas fontes de dados; • Consultar e carregar dados utilizando Cloud SQL e BigQuery; • Construir e manter endpoints utilizando FastAPI seguindo princípios de arquitetura limpa; • Desenvolver testes unitários e de integração utilizando pytest; • Colaborar em revisões de código e manutenção de pipelines de CI/CD no Azure DevOps; • Trabalhar diretamente com dados brutos e pipelines produtivos, garantindo eficiência e confiabilidade; • Traduzir regras de negócio em transformações eficientes utilizando pandas;

🎯 Requirements

• Inglês avançado para comunicação diária com times internacionais; • Experiência sólida com Python (versão 3.10 ou superior); • Domínio de dataclasses, type hints e abstract base classes; • Experiência com pandas e NumPy para processamento de dados em larga escala; • Experiência com scipy para otimização e ajuste de curvas; • Experiência com SQLAlchemy (Core e ORM); • Vivência na construção de APIs assíncronas utilizando FastAPI e asyncio; • Experiência com Cloud SQL e autenticação via IAM no GCP; • Experiência com BigQuery para consulta e carga de dados; • Experiência com Cloud Storage para manipulação de arquivos; • Conhecimento em service accounts e controle de acesso (IAM); • Experiência no design e debugging de pipelines de dados multiestágio; • Forte entendimento de processamento de dados sequenciais ou séries temporais; • Experiência com validação de dados, deduplicação e imputação; • Experiência com pipelines orientados a configuração (YAML); • Experiência com Docker e Docker Compose; • Experiência com pipelines de CI/CD (preferencialmente Azure DevOps); • Experiência com gerenciamento de dependências utilizando Poetry; • Conhecimento básico de Redis como camada de cache; • Capacidade de comunicação clara de decisões técnicas e atuação colaborativa com times multidisciplinares;

🏖️ Benefits

• Cartão multi-benefícios – você escolhe como e onde utilizar. • Bolsas de Estudos para cursos de Graduação, Pós, MBA e Idiomas. • Programas de incentivo à Certificações. • Horário de trabalho flexível. • Salários competitivos. • Avaliação de desempenho anual com plano de carreira estruturado. • Possibilidade de carreira internacional. • Wellhub e TotalPass. • Previdência Privada. • Auxílio-Creche. • Assistência Médica. • Assistência Odontológica. • Seguro de Vida.

Apply Now

Similar Jobs

🕒 6 days ago

Leega

201 - 500

🔌 API

🤖 Artificial Intelligence

Architect and evolve the datalake system for dynamic pricing and machine learning at Leega. Ensure data governance, quality, and responsiveness in a multi-tenant Lakehouse architecture.

🗣️🇧🇷🇵🇹 Portuguese Required

Airflow

Apache

JavaScript

Kafka

PySpark

Python

SQL

🕒 6 days ago

Experian

10,000+ employees

🤖 Artificial Intelligence

🤝 B2B

☁️ SaaS

Junior Data Engineering Analyst at Experian supporting AI solution development and automation in various sectors. Collaborating with experienced professionals to build scalable platforms.

🗣️🇧🇷🇵🇹 Portuguese Required

AWS

Cloud

Docker

NoSQL

Pandas

Python

PyTorch

Scikit-Learn

Spark

SQL

Tensorflow

🕒 6 days ago

INDT - Instituto de Desenvolvimento Tecnológico

201 - 500

🧬 Biotechnology

🔒 Cybersecurity

📡 Telecommunications

Data Engineer supporting customer analytics team with data ingestion and pipeline maintenance. Involves integration of legacy systems and development using Databricks.

🗣️🇧🇷🇵🇹 Portuguese Required

ETL

PySpark

Spark

SQL

🕒 6 days ago

Reply

10,000+ employees

Data Engineer at Reply specializing in modeling and maintaining Palantir data solutions. Collaborating on AI-driven projects and ensuring data governance and quality.

🗣️🇧🇷🇵🇹 Portuguese Required

PySpark

Python

SQL

🕒 June 9

avra

1 - 10

Senior Software Engineer developing data products for Avra’s AI infrastructure in a remote-first environment. Collaborating with cross-functional teams to build and maintain data systems and services.

🗣️🇧🇷🇵🇹 Portuguese Required

AWS

Cloud

Distributed Systems

Google Cloud Platform

Python

Rust

Go