
1 - 10 Mitarbeiter
Gegründet 2023
🤖 Künstliche Intelligenz
☁️ SaaS
🔌 API
Artificial Intelligence • SaaS • API
Featherless AI ist ein Anbieter von serverlosen KI-Inferenz- und Modell-Hosting-Diensten, der API-Zugriff auf einen umfangreichen und wachsenden Katalog von Open-Weight-Modellen (12. 200+) bietet. Dadurch können Entwickler und Unternehmen Modelle in großem Maßstab einsetzen, anpassen und betreiben, ohne Server verwalten zu müssen. Das Unternehmen bietet eine pauschale Abonnementgebühr mit unbegrenzten Token, GPU-Orchestrierung, private/anonyme Nutzung (keine Protokolle) und Optionen für das unternehmensinterne Hosting oder Scale-Einheiten für hohe Parallelität. Featherless AI agiert auch als Forschungslabor für KI mit Fokus auf Open-Source- und Post-Transformer-Modellforschung und beansprucht signifikante Kosten- und Leistungsverbesserungen für große Modelle und KI-Agenten.
🕒 vor 4 Monaten
🗣️🇺🇸🇬🇧 Englisch erforderlich
Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

1 - 10 Mitarbeiter
Gegründet 2023
🤖 Künstliche Intelligenz
☁️ SaaS
🔌 API
Artificial Intelligence • SaaS • API
Featherless AI ist ein Anbieter von serverlosen KI-Inferenz- und Modell-Hosting-Diensten, der API-Zugriff auf einen umfangreichen und wachsenden Katalog von Open-Weight-Modellen (12. 200+) bietet. Dadurch können Entwickler und Unternehmen Modelle in großem Maßstab einsetzen, anpassen und betreiben, ohne Server verwalten zu müssen. Das Unternehmen bietet eine pauschale Abonnementgebühr mit unbegrenzten Token, GPU-Orchestrierung, private/anonyme Nutzung (keine Protokolle) und Optionen für das unternehmensinterne Hosting oder Scale-Einheiten für hohe Parallelität. Featherless AI agiert auch als Forschungslabor für KI mit Fokus auf Open-Source- und Post-Transformer-Modellforschung und beansprucht signifikante Kosten- und Leistungsverbesserungen für große Modelle und KI-Agenten.
• Forschung und Entwurf neuartiger KI‑Architekturen (z. B. Alternativen zu Standard‑Transformer‑Designs, Modelle mit langem Kontext, effiziente Sequenzmodellierung, hybride Architekturen) • Untersuchung von Architekturverbesserungen hinsichtlich Skalierbarkeit, Effizienz und Stabilität • Prototypische Umsetzung und Evaluierung neuer Architekturen durch Ablationsstudien, Benchmarks und empirische Untersuchungen • Verfassen und Mitverfassen von Forschungsarbeiten für führende ML‑Konferenzen und -Zeitschriften • Zusammenarbeit mit Engineering‑Teams, um Forschung in Trainings‑ und Inferenzsysteme zu überführen • Verfolgen des Standes der Forschung und frühzeitiges Erkennen vielversprechender Richtungen
• Fundierte Erfahrung in der Forschung im Bereich Machine Learning mit Schwerpunkt auf Modellarchitekturen • Nachweisbare Veröffentlichungen in ML/AI‑Konferenzen und -Publikationen (z. B. NeurIPS, ICML, ICLR, COLM, ACL, EMNLP, arXiv) • Tiefes Verständnis von: • Neuronalen Netzwerkarchitekturen • Sequenzmodellen und Attention‑Mechanismen • Trainingsdynamik und Optimierung • Praktische Erfahrung mit PyTorch oder JAX • Fähigkeit zu stringenter Argumentation, sauberem Experimentdesign und klarer Kommunikation der Ergebnisse • Sicheres Arbeiten in einem schnelllebigen Startup‑Umfeld • Erfahrung mit nicht‑Transformer‑Architekturen (z. B. RNN‑basiert, state‑space, hybride Modelle) • Arbeit an Modellen mit langem Kontext oder speichereffizienten Modellen • Open‑Source‑Forschungsbeiträge • Erfahrung in der Überführung von Forschung in Produktionssysteme • Hintergrund in effizienter Trainingsgestaltung oder inference‑bewusstem Architekturdesign
• Hohe Verantwortung für Forschungsrichtung und Roadmap • Klare Möglichkeiten zur Veröffentlichung wirkungsvoller Forschung • Kurze Feedback‑Schleifen zwischen Forschung und praktischer Anwendung/Deployment • Kleines, hochspezialisiertes Team mit starker Forschungskultur • Wettbewerbsfähige Vergütung und aussagekräftige Equity‑Beteiligung
Jetzt Bewerben