Engenheiro(a) de Machine Learning — Otimização de Treinamento

Vaga não está no LinkedIn

🕒 Janeiro 22

🌏 Qualquer lugar do mundo

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🤖 Engenheiro de Machine Learning

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Featherless AI

Featherless AI

1 - 10 funcionários

Fundada em 2023

🤖 Inteligência Artificial

☁️ SaaS

🔌 API

Artificial Intelligence • SaaS • API

A Featherless AI é um provedor de inferência de IA sem servidor e hospedagem de modelos que oferece acesso via API a um grande e crescente catálogo de modelos de pesos abertos (12. 200+), permitindo que desenvolvedores e empresas implante, ajustem e executem modelos em escala sem gerenciar servidores. A empresa oferece preços de assinatura fixa com tokens ilimitados, orquestração de GPU, uso privado/anônimo (sem logs) e opções para hospedagem própria em nível empresarial ou unidades de escala para alta concorrência. A Featherless AI também opera como um laboratório de pesquisa em IA focado em modelos de código aberto e pós-transformadores, alegando melhorias significativas de custo e desempenho para modelos grandes e agentes de IA.

Descrição

• Otimizar pipelines de treinamento de modelos em larga escala (throughput, convergência, estabilidade e custo) • Aperfeiçoar estratégias de treinamento distribuído (paralelismo de dados, de modelo e de pipeline) • Ajustar otimizadores, schedulers, tamanho de batch e precisão (bf16 / fp16 / fp8) • Reduzir tempo de treinamento e custo computacional por meio de profiling, análise de gargalos e melhorias em nível de sistema • Colaborar com pesquisadores em estratégias de treinamento orientadas à arquitetura • Construir e manter infraestrutura de treinamento robusta (checkpointing, tolerância a falhas, reprodutibilidade) • Avaliar e integrar novas técnicas de treinamento (por exemplo, gradient checkpointing, ZeRO, FSDP, kernels personalizados) • Ser responsável pelas métricas de desempenho de treinamento e promovê-las continuamente

🎯 Requisitos

• Experiência sólida em treinar redes neurais de grande escala (LLMs ou modelos de tamanho semelhante) • Experiência prática em otimização de treinamento (não apenas uso de modelos) • Sólido entendimento de: • - Backpropagation, algoritmos de otimização e dinâmica de treinamento • - Sistemas distribuídos para treinamento de ML • Experiência com PyTorch (obrigatório) • Conforto para trabalhar próximo ao hardware (GPUs, restrições de memória e de rede) • Capacidade de transitar com facilidade entre ideias de pesquisa e código pronto para produção • Desejável • Experiência com treinamento distribuído em larga escala (multi-node, multi-GPU) • Familiaridade com DeepSpeed, FSDP, Megatron ou stacks de treinamento customizados • Experiência em otimizar treinamento em GPUs AMD ou NVIDIA • Contribuições para infraestruturas ML open-source ou codebases de pesquisa • Experiência com arquiteturas não-Transformer (RNNs, modelos híbridos, etc.)

🏖️ Benefícios

• Remuneração competitiva + participação acionária significativa

Candidatar-se

Vagas Similares

🕒 Janeiro 8

Prolific

51 - 200

🤝 B2B

Treinador de IA avaliando modelos de IA para os dados humanos de qualidade da Prolific. Buscamos especialistas para tarefas de IA com horário flexível e remuneração competitiva.

🌏 Qualquer lugar do mundo

💵 $150 / hora

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🤖 Engenheiro de Machine Learning

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Agosto 17, 2025

GoML

51 - 200

🤖 Inteligência Artificial

🤝 B2B

💊 Farmacêutico

Arquiteto Técnico especializado em soluções AWS e AI para os projetos com clientes da Neuralgo Software. Responsável pelo design da arquitetura e pela colaboração entre equipes multifuncionais para sistemas escaláveis em nuvem.

🌏 Qualquer lugar do mundo

⏰ Tempo Integral

🟠 Sênior

🔴 Especialista

🤖 Engenheiro de Machine Learning

🗣️🇺🇸🇬🇧 Inglês obrigatório