Stefanini Brasil

Site LinkedIn

10.000+ funcionários

Fundada em 1987

🤖 Inteligência Artificial

🔒 Cibersegurança

Artificial Intelligence • Cybersecurity • Cloud

A Stefanini Brasil é uma provedora líder de soluções de transformação digital, oferecendo um portfólio de serviços que inclui inteligência artificial, cibersegurança, cloud enablement e consultoria. Com mais de 35 anos de experiência, a empresa se dedica a integrar tecnologias inovadoras para ajudar organizações de diversos setores a aprimorar suas operações e a experiência de seus clientes. Sua expertise abrange segmentos como saúde, varejo e bens industriais, possibilitando que as empresas otimizem processos e gerem valor por meio da tecnologia.

ENGENHEIRO DE DADOS PL

Vaga não está no LinkedIn

🕒 Maio 19

🏢🏡 Brasília – Híbrido

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🚰 Engenheiro de Dados

🗣️🇧🇷🇵🇹 Português obrigatório

Azure

ETL

PySpark

Python

Spark

Candidatar-se

Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Stefanini Brasil

Site LinkedIn

10.000+ funcionários

Fundada em 1987

🤖 Inteligência Artificial

🔒 Cibersegurança

Artificial Intelligence • Cybersecurity • Cloud

Descrição

• Atuar no desenvolvimento de pipelines de ingestão, transformação e enriquecimento de dados para uso em IA • Trabalhar com dados estruturados e não estruturados (textos, PDFs, HTML, áudios, entre outros) • Implementar processos de chunking, embeddings e indexação vetorial • Construir e manter datasets voltados à matriz de conhecimento corporativa • Desenvolver pipelines utilizando Databricks (Spark / PySpark) • Atuar com arquitetura medalhão (bronze, prata e ouro) • Integrar dados com bancos vetoriais (Azure AI Search, pgvector, entre outros) • Garantir performance, escalabilidade e confiabilidade dos pipelines • Aplicar boas práticas de qualidade de dados (completude, consistência e versionamento) • Implementar políticas de atualização, retenção e expurgo de dados • Garantir rastreabilidade e auditabilidade dos dados utilizados pelos modelos • Atuar em conjunto com times de AI/ML na preparação e otimização de dados • Apoiar estratégias de recuperação de informação (RAG) • Otimizar dados para melhorar a relevância e precisão das respostas dos modelos

🎯 Requisitos

• Ensino superior completo em Tecnologia da Informação, Engenharia, Sistemas de Informação ou áreas correlatas • Experiência sólida em engenharia de dados • Conhecimento em Python e/ou PySpark • Experiência com Databricks e Spark (batch e/ou streaming) • Experiência com pipelines de dados (ETL/ELT) • Modelagem de dados (Data Lake / Lakehouse) • Experiência com dados não estruturados (documentos, textos, etc.) • Integração e consumo de APIs • Capacidade de atuar com autonomia na construção de pipelines • Conhecimento em arquitetura moderna de dados • Experiência com processamento e preparação de dados para IA • Atuação em ambientes complexos com múltiplas integrações

🏖️ Benefícios

• Vale-alimentação ou vale-refeição; • Desconto em cursos, universidades e instituições de idiomas; • Academia Stefanini — plataforma com cursos on-line, gratuitos, atualizados e com certificado; • Mentoring; • Clube de vantagens para consultas e exames; • Assistência médica; • Assistência odontológica; • Clube de vantagens e descontos nos melhores estabelecimentos; • Clube de viagens; • Convênio para pets.

Candidatar-se

Desenvolvido por Lior Neu-ner. Adoraria receber seu feedback — entre em contato por DM ou pelo e-mail [email protected]