
1 - 10 Mitarbeiter
Gegründet 2023
🤖 Künstliche Intelligenz
☁️ SaaS
🔌 API
Artificial Intelligence • SaaS • API
Featherless AI ist ein Anbieter von serverlosen KI-Inferenz- und Modell-Hosting-Diensten, der API-Zugriff auf einen umfangreichen und wachsenden Katalog von Open-Weight-Modellen (12. 200+) bietet. Dadurch können Entwickler und Unternehmen Modelle in großem Maßstab einsetzen, anpassen und betreiben, ohne Server verwalten zu müssen. Das Unternehmen bietet eine pauschale Abonnementgebühr mit unbegrenzten Token, GPU-Orchestrierung, private/anonyme Nutzung (keine Protokolle) und Optionen für das unternehmensinterne Hosting oder Scale-Einheiten für hohe Parallelität. Featherless AI agiert auch als Forschungslabor für KI mit Fokus auf Open-Source- und Post-Transformer-Modellforschung und beansprucht signifikante Kosten- und Leistungsverbesserungen für große Modelle und KI-Agenten.
🕒 vor 4 Monaten
🗣️🇺🇸🇬🇧 Englisch erforderlich
Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

1 - 10 Mitarbeiter
Gegründet 2023
🤖 Künstliche Intelligenz
☁️ SaaS
🔌 API
Artificial Intelligence • SaaS • API
Featherless AI ist ein Anbieter von serverlosen KI-Inferenz- und Modell-Hosting-Diensten, der API-Zugriff auf einen umfangreichen und wachsenden Katalog von Open-Weight-Modellen (12. 200+) bietet. Dadurch können Entwickler und Unternehmen Modelle in großem Maßstab einsetzen, anpassen und betreiben, ohne Server verwalten zu müssen. Das Unternehmen bietet eine pauschale Abonnementgebühr mit unbegrenzten Token, GPU-Orchestrierung, private/anonyme Nutzung (keine Protokolle) und Optionen für das unternehmensinterne Hosting oder Scale-Einheiten für hohe Parallelität. Featherless AI agiert auch als Forschungslabor für KI mit Fokus auf Open-Source- und Post-Transformer-Modellforschung und beansprucht signifikante Kosten- und Leistungsverbesserungen für große Modelle und KI-Agenten.
• Entwerfen und bewerten von Model-Distillation-Techniken (teacher–student training, self-distillation, layer-wise distillation, representation matching etc.) • Untersuchung von Trade-offs zwischen Modellgröße, Latenz, Speicherbedarf und Genauigkeit • Entwicklung neuartiger Distillation-Ansätze für: • - Große Sprachmodelle • - Langkontext- oder spezialisierte Architekturen • - Inferenzbeschränkte Umgebungen • Durchführung groß angelegter Experimente und Ablationsstudien; rigorose Analyse der Ergebnisse • Zusammenarbeit mit Ingenieurteams zur Produktionsreife von Forschungsergebnissen • Verfassen und Einreichen von Forschungsarbeiten bei führenden Konferenzen (NeurIPS, ICML, ICLR, COLM etc.) • Beitrag zu internen Research-Notes, technischen Blogs und Open‑Source‑Projekten, wenn sinnvoll
• Fundierter Hintergrund in der Machine-Learning-Forschung • Praktische Erfahrung mit Model Distillation oder eng verwandten Themen (Compression, Pruning, Quantization, Representation Learning) • Publikationserfahrung (Konferenz‑ oder Journalbeiträge, Workshop‑Papers oder arXiv‑Preprints) • Solides Verständnis der Grundlagen des Deep Learning (Optimierung, Trainingsdynamik, Generalisierung) • Sicherer Umgang mit PyTorch (oder äquivalenten Frameworks) und research‑tauglicher Experimentierpraxis • Fähigkeit, Forschungsideen, Ergebnisse und deren Limitationen klar zu kommunizieren • Erfahrung in der Distillation großer Sprachmodelle (wünschenswert) • Forschung mit Fokus auf Effizienz (Latenz, Speicher, Durchsatz) (wünschenswert) • Erfahrung mit Langkontext-Modellen oder nicht‑Transformer‑Architekturen (wünschenswert) • Open‑Source‑Beiträge im ML‑ oder Research‑Tooling‑Bereich (wünschenswert) • Frühere Erfahrung in Startups oder angewandter Forschung (wünschenswert)
• Echte Verantwortung und Ownership der Forschungsrichtung in einem Series‑A‑Unternehmen • Starke Unterstützung für Publikationen und offene Forschung • Kurzzyklische Rückkopplung zwischen Forschung und realer Produktbereitstellung • Zugang zu bedeutsamer Rechenkapazität und Produktions‑Skalierungsproblemen • Kleines, hochqualifiziertes Team mit tiefgehender ML‑ und Systemkompetenz
Jetzt Bewerben