Featherless AI

Website LinkedIn Alle Stellen

1 - 10 Mitarbeiter

Gegründet 2023

🤖 Künstliche Intelligenz

☁️ SaaS

🔌 API

Artificial Intelligence • SaaS • API

Featherless AI ist ein Anbieter von serverlosen KI-Inferenz- und Modell-Hosting-Diensten, der API-Zugriff auf einen umfangreichen und wachsenden Katalog von Open-Weight-Modellen (12. 200+) bietet. Dadurch können Entwickler und Unternehmen Modelle in großem Maßstab einsetzen, anpassen und betreiben, ohne Server verwalten zu müssen. Das Unternehmen bietet eine pauschale Abonnementgebühr mit unbegrenzten Token, GPU-Orchestrierung, private/anonyme Nutzung (keine Protokolle) und Optionen für das unternehmensinterne Hosting oder Scale-Einheiten für hohe Parallelität. Featherless AI agiert auch als Forschungslabor für KI mit Fokus auf Open-Source- und Post-Transformer-Modellforschung und beansprucht signifikante Kosten- und Leistungsverbesserungen für große Modelle und KI-Agenten.

KI-Forscher – Distillation

Stelle nicht auf LinkedIn

🕒 vor 4 Monaten

🌏 Überall auf der Welt

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

🧠 KI-Forscher

🗣️🇺🇸🇬🇧 Englisch erforderlich

PyTorch

Jetzt Bewerben

Ähnliche Remote-Jobs finden

📊 Überprüfen Sie Ihre Lebenslauf-Bewertung für diese Stelle

Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

Featherless AI

Website LinkedIn Alle Stellen

1 - 10 Mitarbeiter

Gegründet 2023

🤖 Künstliche Intelligenz

☁️ SaaS

🔌 API

Artificial Intelligence • SaaS • API

Beschreibung

• Entwerfen und bewerten von Model-Distillation-Techniken (teacher–student training, self-distillation, layer-wise distillation, representation matching etc.) • Untersuchung von Trade-offs zwischen Modellgröße, Latenz, Speicherbedarf und Genauigkeit • Entwicklung neuartiger Distillation-Ansätze für: • - Große Sprachmodelle • - Langkontext- oder spezialisierte Architekturen • - Inferenzbeschränkte Umgebungen • Durchführung groß angelegter Experimente und Ablationsstudien; rigorose Analyse der Ergebnisse • Zusammenarbeit mit Ingenieurteams zur Produktionsreife von Forschungsergebnissen • Verfassen und Einreichen von Forschungsarbeiten bei führenden Konferenzen (NeurIPS, ICML, ICLR, COLM etc.) • Beitrag zu internen Research-Notes, technischen Blogs und Open‑Source‑Projekten, wenn sinnvoll

🎯 Anforderungen

• Fundierter Hintergrund in der Machine-Learning-Forschung • Praktische Erfahrung mit Model Distillation oder eng verwandten Themen (Compression, Pruning, Quantization, Representation Learning) • Publikationserfahrung (Konferenz‑ oder Journalbeiträge, Workshop‑Papers oder arXiv‑Preprints) • Solides Verständnis der Grundlagen des Deep Learning (Optimierung, Trainingsdynamik, Generalisierung) • Sicherer Umgang mit PyTorch (oder äquivalenten Frameworks) und research‑tauglicher Experimentierpraxis • Fähigkeit, Forschungsideen, Ergebnisse und deren Limitationen klar zu kommunizieren • Erfahrung in der Distillation großer Sprachmodelle (wünschenswert) • Forschung mit Fokus auf Effizienz (Latenz, Speicher, Durchsatz) (wünschenswert) • Erfahrung mit Langkontext-Modellen oder nicht‑Transformer‑Architekturen (wünschenswert) • Open‑Source‑Beiträge im ML‑ oder Research‑Tooling‑Bereich (wünschenswert) • Frühere Erfahrung in Startups oder angewandter Forschung (wünschenswert)

🏖️ Vorteile

• Echte Verantwortung und Ownership der Forschungsrichtung in einem Series‑A‑Unternehmen • Starke Unterstützung für Publikationen und offene Forschung • Kurzzyklische Rückkopplung zwischen Forschung und realer Produktbereitstellung • Zugang zu bedeutsamer Rechenkapazität und Produktions‑Skalierungsproblemen • Kleines, hochqualifiziertes Team mit tiefgehender ML‑ und Systemkompetenz

Jetzt Bewerben

Entwickelt von Lior Neu-ner. Ich freue mich über Ihr Feedback — kontaktieren Sie mich per DM oder per E-Mail [email protected]