Cientista de Dados Junior

Vaga não está no LinkedIn

Novembro 12

🇧🇷 Brasil – Remoto

⏰ Tempo Integral

🟢 Júnior

📊 Cientista de Dados

🚫👨‍🎓 Sem graduação necessária

🗣️🇧🇷🇵🇹 Português obrigatório

Candidatar-se
Logo of Leega

Leega

API • Artificial Intelligence • Cloud Solutions

A Leega é uma provedora líder de soluções de tecnologia na América Latina, especializada em analytics de dados e soluções em nuvem. Primeira empresa na região certificada pelo Google Cloud em Data Analytics, a Leega oferece um portfólio de serviços que inclui desenvolvimento de aplicações, machine learning e analytics para gestão de riscos. A empresa faz parcerias com os principais provedores de nuvem, como AWS e Microsoft Azure, para ajudar as empresas a aprimorar a gestão de dados e realizar uma migração eficiente para a nuvem, impulsionando a transformação digital e a inovação.

201 - 500 funcionários

Fundada em 2010

🔌 API

🤖 Inteligência Artificial

Descrição

• Compreender as Necessidades do Negócio e Requisitos de ML/IA: Colaborar com stakeholders e Cientistas de Dados Sêniores para entender os problemas de negócio e traduzi-los em hipóteses testáveis e projetos de Machine Learning. • Participar de Discussões Baseadas em Dados e IA: Contribuir com análises iniciais, insights e propostas de modelos para solucionar desafios de dados e IA. • Interface entre Times de Tecnologia e Data Science: Trabalhar em sinergia com Engenheiros de Dados e Arquitetos para garantir a disponibilidade dos dados e o treinamento eficiente dos modelos. • Preparação e Exploração de Dados no Azure Databricks: Realizar a limpeza, transformação, padronização e enriquecimento de dados brutos utilizando o poder de processamento do Azure Databricks e Spark. • Conduzir a Análise Exploratória de Dados (EDA) para entender distribuições, identificar outliers e selecionar features relevantes (Feature Engineering) • Desenvolvimento e Validação de Modelos de ML: Construir, treinar e validar modelos preditivos (regressão, classificação, clustering) utilizando frameworks de Ciência de Dados como Scikit-Learn, TensorFlow ou PyTorch. • Documentar e apresentar os resultados e métricas de desempenho dos modelos (e.g., AUC, F1-Score). • Apoiar a Operacionalização (MLOps): Auxiliar na transição dos modelos desenvolvidos para ambientes de produção, utilizando ferramentas como MLflow para rastreamento e gerenciamento de experimentos e modelos no Azure Databricks. • Monitoramento da Qualidade dos Dados e Modelos: Acompanhar a qualidade, integridade e drift dos dados e o desempenho dos modelos em produção, propondo ajustes quando necessário.

🎯 Requisitos

• Experiência com ferramentas para CI/CD e automação de fluxos de machine learning. • Observabilidade de Dados. • Familiaridade com ferramentas de monitoramento e validação de dados, • Orquestração de Pipelines. • Conhecimento em SQL. • Data Lakes e Data Warehouses: • Capacidade de gerenciar Data Lakes para preparação de dados de IA, com foco em Azure Databricks. • Armazenamento de Features. • Azure + Databricks. • Capacidade de colaborar com os demais Cientistas de Dados para preparar conjuntos de dados para modelos de IA, garantindo alta qualidade e performance. • Implementação de pipelines automatizados para treinamento, validação, deployment e monitoramento de modelos de IA. • Capacidade de definir e gerenciar repositórios de features para modelos de IA (Feature Engineering). • Conhecimento de LGPD/GDPR para garantir conformidade regulatória no tratamento de dados para IA. • Experiência de trabalho com metodologias ágeis (Scrum/Kanban). • Capacidade de entender requisitos de negócio e convertê-los em soluções técnicas para IA. • Foco em Azure Databricks: Conhecimento e experiência prática na utilização de Azure Databricks para processamento e análise de dados, incluindo a utilização de notebooks (Python/Spark) e gerenciamento de clusters. • Entendimento do conceito de Feature Store e experiência em consumir dados de Data Lakes (preferencialmente Azure Data Lake Storage) e estruturar dados para o consumo de modelos. • Linguagens: Python (Imprescindível) para manipulação de dados (Pandas, NumPy) e desenvolvimento de modelos. • Experiência prática com as principais bibliotecas e frameworks como Scikit-Learn, TensorFlow/Keras ou PyTorch e bibliotecas como XGBoost/LightGBM. • Noções de uso do MLflow para rastreamento e versionamento de modelos e experimentos no ambiente Databricks. • Proficiência em SQL/Spark SQL para consulta e manipulação de dados em larga escala.

🏖️ Benefícios

• 🏥 Convênio Médico Porto Seguro • 🦷 Convênio Odontológico Porto Seguro • 💰 Participação nos Lucros e Resultados (PLR) • 👶 Auxílio Creche • 🍽️ Vale Alimentação e Refeição Alelo • 💻 Auxílio Home Office • 📚 Parcerias com Instituições de Ensino • 🚀 Incentivo para Certificações, inclusive em Cloud • 🎁 Pontos Livelo • 🏋️‍♂️ TotalPass • 🧘‍♂️Mindself

Candidatar-se

Vagas Similares

Novembro 9

High 5 Games

51 - 200

🎮 Jogos

🎲 Jogos de Azar

🤝 B2B

Cientista de Dados Júnior desenvolvendo soluções analíticas para a indústria de games. Colabora no desenvolvimento de pipelines de dados e modelos de machine learning para aumentar o engajamento dos jogadores e impulsionar a inovação de produto.

🗣️🇺🇸🇬🇧 Inglês obrigatório

Abril 26

Runtalent

501 - 1000

🤝 B2B

👥 RH Tech

☁️ SaaS

Vaga remota para cientista de dados focada em modelos preditivos e grandes volumes de dados. Requer experiência em Python e bibliotecas de machine learning.

🗣️🇧🇷🇵🇹 Português obrigatório

Desenvolvido por Lior Neu-ner. Adoraria receber seu feedback — entre em contato por DM ou pelo e-mail support@remoterocketship.com