
1 - 10 funcionários
Fundada em 2023
🤖 Inteligência Artificial
☁️ SaaS
🔌 API
Artificial Intelligence • SaaS • API
A Featherless AI é um provedor de inferência de IA sem servidor e hospedagem de modelos que oferece acesso via API a um grande e crescente catálogo de modelos de pesos abertos (12. 200+), permitindo que desenvolvedores e empresas implante, ajustem e executem modelos em escala sem gerenciar servidores. A empresa oferece preços de assinatura fixa com tokens ilimitados, orquestração de GPU, uso privado/anônimo (sem logs) e opções para hospedagem própria em nível empresarial ou unidades de escala para alta concorrência. A Featherless AI também opera como um laboratório de pesquisa em IA focado em modelos de código aberto e pós-transformadores, alegando melhorias significativas de custo e desempenho para modelos grandes e agentes de IA.
🕒 Janeiro 23
🗣️🇺🇸🇬🇧 Inglês obrigatório
Melhore suas chances de conseguir uma entrevista verificando sua pontuação de currículo antes de se candidatar.

1 - 10 funcionários
Fundada em 2023
🤖 Inteligência Artificial
☁️ SaaS
🔌 API
Artificial Intelligence • SaaS • API
A Featherless AI é um provedor de inferência de IA sem servidor e hospedagem de modelos que oferece acesso via API a um grande e crescente catálogo de modelos de pesos abertos (12. 200+), permitindo que desenvolvedores e empresas implante, ajustem e executem modelos em escala sem gerenciar servidores. A empresa oferece preços de assinatura fixa com tokens ilimitados, orquestração de GPU, uso privado/anônimo (sem logs) e opções para hospedagem própria em nível empresarial ou unidades de escala para alta concorrência. A Featherless AI também opera como um laboratório de pesquisa em IA focado em modelos de código aberto e pós-transformadores, alegando melhorias significativas de custo e desempenho para modelos grandes e agentes de IA.
• Projetar e avaliar técnicas de model distillation (teacher–student training, self-distillation, layer-wise distillation, representation matching, etc.) • Pesquisar trade-offs entre tamanho do modelo, latência, uso de memória e acurácia • Desenvolver abordagens de distillation inovadoras para: • - Large language models (LLMs) • - Arquiteturas de longo contexto ou especializadas • - Ambientes com restrição de inferência (inference-constrained environments) • Conduzir experimentos em grande escala e estudos de ablação; analisar resultados de forma rigorosa • Colaborar com engenheiros para colocar em produção os resultados da pesquisa • Redigir e submeter artigos de pesquisa para conferências de alto nível (NeurIPS, ICML, ICLR, COLM, etc.) • Contribuir com notas internas de pesquisa, blogs técnicos e projetos open-source quando apropriado
• Sólida formação em pesquisa em machine learning • Experiência prática com model distillation ou tópicos relacionados (compressão, pruning, quantization, representation learning) • Experiência com publicações (artigos de conferência ou periódico, artigos de workshop ou preprints no arXiv) • Compreensão sólida dos fundamentos de deep learning (otimização, dinâmica de treinamento, generalização) • Domínio de PyTorch (ou equivalente) e experimentação em nível de pesquisa • Capacidade de comunicar claramente ideias de pesquisa, resultados e limitações • Experiência em distillation de large language models (desejável) • Trabalhos focados em eficiência (latência, memória, throughput) (desejável) • Experiência com modelos de longo contexto ou arquiteturas não-Transformer (desejável) • Contribuições open-source em ML ou em ferramentas de pesquisa (desejável) • Experiência prévia em startups ou pesquisa aplicada (desejável)
• Responsabilidade real sobre a direção da pesquisa em estágio Series A • Forte suporte para publicação e pesquisa aberta • Ciclo de feedback curto entre pesquisa e implantação no mundo real • Acesso a recursos computacionais significativos e problemas em escala de produção • Equipe pequena e altamente técnica com profunda expertise em ML e sistemas
Candidatar-se