Engenheiro de Machine Learning — Dados Multilíngues

Vaga não está no LinkedIn

🕒 Janeiro 22

🌏 Qualquer lugar do mundo

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🤖 Engenheiro de Machine Learning

🗣️🇺🇸🇬🇧 Inglês obrigatório

Candidatar-se
Encontrar Vagas Remotas Similares

📊 Verifique sua pontuação de currículo para esta vaga

Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

Logo of Featherless AI

Featherless AI

1 - 10 funcionários

Fundada em 2023

🤖 Inteligência Artificial

☁️ SaaS

🔌 API

Artificial Intelligence • SaaS • API

A Featherless AI é um provedor de inferência de IA sem servidor e hospedagem de modelos que oferece acesso via API a um grande e crescente catálogo de modelos de pesos abertos (12. 200+), permitindo que desenvolvedores e empresas implante, ajustem e executem modelos em escala sem gerenciar servidores. A empresa oferece preços de assinatura fixa com tokens ilimitados, orquestração de GPU, uso privado/anônimo (sem logs) e opções para hospedagem própria em nível empresarial ou unidades de escala para alta concorrência. A Featherless AI também opera como um laboratório de pesquisa em IA focado em modelos de código aberto e pós-transformadores, alegando melhorias significativas de custo e desempenho para modelos grandes e agentes de IA.

Descrição

• Projetar, construir e manter conjuntos de dados multilíngues em grande escala, abrangendo línguas com muitos recursos (high-resource) e com poucos recursos (low-resource) • Desenvolver pipelines de dados para coleta, limpeza, normalização, deduplicação e rotulagem • Implementar filtros de qualidade usando métodos estatísticos, heurísticos e baseados em modelos • Trabalhar com pesquisadores para definir cobertura linguística, benchmarks e métricas de avaliação • Analisar vieses dos conjuntos de dados, lacunas de cobertura e modos de falha entre regiões e scripts (sistemas de escrita) • Dar suporte a fluxos de trabalho de treinamento, fine-tuning e distillation com dados multilíngues de alta qualidade • Iterar continuamente nos conjuntos de dados com base no desempenho dos modelos e no uso no mundo real

🎯 Requisitos

• 3+ anos de experiência como ML Engineer, Applied Scientist ou em função similar • Experiência sólida com conjuntos de dados multilíngues ou não em inglês • Entendimento sólido dos fundamentos de NLP (tokenização, embeddings, modelagem de linguagem) • Experiência na construção de pipelines de dados escaláveis (Python, Spark, Ray ou similares) • Familiaridade com Unicode, scripts (sistemas de escrita), desafios de tokenização e particularidades específicas de cada língua • Conforto em colaborar com pesquisadores e em traduzir necessidades de pesquisa para sistemas de produção

🏖️ Benefícios

• Remuneração competitiva + participação acionária relevante em estágio Series A

Candidatar-se

Vagas Similares

🕒 Janeiro 8

Prolific

51 - 200

🤝 B2B

Treinador de IA avaliando modelos de IA para os dados humanos de qualidade da Prolific. Buscamos especialistas para tarefas de IA com horário flexível e remuneração competitiva.

🌏 Qualquer lugar do mundo

💵 $150 / hora

⏰ Tempo Integral

🟡 Pleno

🟠 Sênior

🤖 Engenheiro de Machine Learning

🗣️🇺🇸🇬🇧 Inglês obrigatório

🕒 Agosto 17, 2025

GoML

51 - 200

🤖 Inteligência Artificial

🤝 B2B

💊 Farmacêutico

Arquiteto Técnico especializado em soluções AWS e AI para os projetos com clientes da Neuralgo Software. Responsável pelo design da arquitetura e pela colaboração entre equipes multifuncionais para sistemas escaláveis em nuvem.

🌏 Qualquer lugar do mundo

⏰ Tempo Integral

🟠 Sênior

🔴 Especialista

🤖 Engenheiro de Machine Learning

🗣️🇺🇸🇬🇧 Inglês obrigatório