ENGENHEIRO DE DADOS PL

Vaga não está no LinkedIn

🕒 Maio 19

🏢🏡 Brasília – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Stefanini Brasil

Stefanini Brasil

SiteLinkedIn

10.000+ funcionários

Fundada em 1987

🤖 Inteligência Artificial

🔒 Cibersegurança

Artificial Intelligence • Cybersecurity • Cloud

A Stefanini Brasil é uma provedora líder de soluções de transformação digital, oferecendo um portfólio de serviços que inclui inteligência artificial, cibersegurança, cloud enablement e consultoria. Com mais de 35 anos de experiência, a empresa se dedica a integrar tecnologias inovadoras para ajudar organizações de diversos setores a aprimorar suas operações e a experiência de seus clientes. Sua expertise abrange segmentos como saúde, varejo e bens industriais, possibilitando que as empresas otimizem processos e gerem valor por meio da tecnologia.

Descrição

• Atuar no desenvolvimento de pipelines de ingestão, transformação e enriquecimento de dados para uso em IA • Trabalhar com dados estruturados e não estruturados (textos, PDFs, HTML, áudios, entre outros) • Implementar processos de chunking, embeddings e indexação vetorial • Construir e manter datasets voltados à matriz de conhecimento corporativa • Desenvolver pipelines utilizando Databricks (Spark / PySpark) • Atuar com arquitetura medalhão (bronze, prata e ouro) • Integrar dados com bancos vetoriais (Azure AI Search, pgvector, entre outros) • Garantir performance, escalabilidade e confiabilidade dos pipelines • Aplicar boas práticas de qualidade de dados (completude, consistência e versionamento) • Implementar políticas de atualização, retenção e expurgo de dados • Garantir rastreabilidade e auditabilidade dos dados utilizados pelos modelos • Atuar em conjunto com times de AI/ML na preparação e otimização de dados • Apoiar estratégias de recuperação de informação (RAG) • Otimizar dados para melhorar a relevância e precisão das respostas dos modelos

🎯 Requisitos

• Ensino superior completo em Tecnologia da Informação, Engenharia, Sistemas de Informação ou áreas correlatas • Experiência sólida em engenharia de dados • Conhecimento em Python e/ou PySpark • Experiência com Databricks e Spark (batch e/ou streaming) • Experiência com pipelines de dados (ETL/ELT) • Modelagem de dados (Data Lake / Lakehouse) • Experiência com dados não estruturados (documentos, textos, etc.) • Integração e consumo de APIs • Capacidade de atuar com autonomia na construção de pipelines • Conhecimento em arquitetura moderna de dados • Experiência com processamento e preparação de dados para IA • Atuação em ambientes complexos com múltiplas integrações

🏖️ Benefícios

• Vale-alimentação ou vale-refeição; • Desconto em cursos, universidades e instituições de idiomas; • Academia Stefanini — plataforma com cursos on-line, gratuitos, atualizados e com certificado; • Mentoring; • Clube de vantagens para consultas e exames; • Assistência médica; • Assistência odontológica; • Clube de vantagens e descontos nos melhores estabelecimentos; • Clube de viagens; • Convênio para pets.

Candidatar-se