Data Scientist | LLM Engineer

🔥 vor 1 Minute

🌏 Überall auf der Welt

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

📊 Data Scientist

🗣️🇺🇸🇬🇧 Englisch erforderlich

Jetzt Bewerben
Ähnliche Remote-Jobs finden

📊 Überprüfen Sie Ihre Lebenslauf-Bewertung für diese Stelle

Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

Logo of TEKEVER

TEKEVER

1001 - 5000 Mitarbeiter

Gegründet 2001

🚀 Luft- und Raumfahrt

🔧 Hardware

🤝 B2B

💰 €534.202.302 Venture Round - TEKEVER im 2025-05

Aerospace • Hardware • B2B

<TEKEVER> ist ein Technologieunternehmen, das sich auf unbemannte Systeme und Satellitensysteme der nächsten Generation spezialisiert hat und integrierte Hardware- und Softwarelösungen sowie zugehörige Dienstleistungen anbietet. Das Unternehmen bietet digitale Transformation, Plattform- und Softwareentwicklung, Lufttüchtigkeit, 3D-Druck, Schulungen und Beratung für kommerzielle und staatliche Kunden an verschiedenen internationalen Standorten. TEKEVER konzentriert sich auf missionskritische, hardware-integrierte Systeme und Dienstleistungen für Luftfahrt- und verteidigungsbezogene Anwendungen.

Beschreibung

• Entwicklung, Implementierung und Optimierung fortschrittlicher Algorithmen, Modelle und Funktionen, die Teams helfen, ihre Arbeitslasten zu automatisieren. • Mitarbeit an vielfältigen Projekten, die das Verstehen, Verarbeiten und Generieren menschlicher Sprache zur Lösung komplexer Probleme und zur Schaffung innovativer Lösungen umfassen. • Entwurf, Entwicklung und Implementierung modernster Algorithmen und Modelle im Kontext von Sprachmodellen. • Realisierung neuer KI-basierter Funktionen in Bereichen wie Entscheidungsunterstützung, Einsatzplanung und Workflow-Automatisierung. • Training und Optimierung großer Sprachmodelle (LLMs) unter Verwendung großer Mengen textueller Daten zur Sicherstellung hoher Leistung und Genauigkeit. • Durchführung von Datenvorverarbeitungsaufgaben wie Tokenisierung, Stemming, Lemmatisierung und Normalisierung zur Vorbereitung von Datensätzen für Training und Evaluierung. • Fortlaufende Verfolgung der neuesten Entwicklungen in LLM und Natural Language Processing (NLP) und Anwendung neuer Techniken zur Verbesserung bestehender Modelle und zur Entwicklung neuer Lösungen. • Enge Zusammenarbeit mit Data Engineers, Softwareentwicklern, Produktmanagern und weiteren Stakeholdern, um Projektanforderungen zu verstehen und effektive Lösungen zu liefern. • Bewertung der Modellleistung mittels geeigneter Metriken und Techniken und iterative Verbesserung von Genauigkeit und Effizienz. • Zusammenarbeit mit Engineering-Teams zur Bereitstellung von Modellen in Produktionsumgebungen und Sicherstellung ihrer Robustheit und Skalierbarkeit. • Pflege umfassender Dokumentation zu Modellen, Algorithmen und Prozessen für zukünftige Referenz und Reproduzierbarkeit.

🎯 Anforderungen

• Bachelor- oder Masterabschluss in Informatik, Data Science oder einem verwandten Fachgebiet. Eine Promotion ist von Vorteil. • Mindestens 3 Jahre Erfahrung in Data Science mit Schwerpunkt auf großen Sprachmodellen (LLMs) und NLP. • Fundierte Programmierkenntnisse in Python sowie Erfahrung mit NLP- und LLM-Bibliotheken wie spaCy, Hugging Face (Transformers, Datasets, PEFT, TRL) und den wichtigsten Modellfamilien (z. B. GPT, Claude, Gemini, Llama, Mistral, Qwen, Gemma) sowohl über APIs als auch über offene Gewichte. • Versiert im Umgang mit Deep-Learning-Frameworks, vorzugsweise PyTorch (ggf. zusätzlich Keras/TensorFlow), und vertraut mit Inferenzoptimierung (Quantisierung, TensorRT-LLM). • Erfahrung mit Datenvorverarbeitung, Kuratierung und Tokenisierung für LLM-Workloads, einschließlich Aufbau und Bereinigung von Datensätzen für Fine-Tuning und Retrieval (Chunking, Embeddings, Deduplizierung, Generierung synthetischer Daten). • Solides Verständnis von Transformer-Architekturen und Attention sowie praktische Kenntnisse in Fine-Tuning- und Alignment-Techniken (Full Fine-Tuning, LoRA/QLoRA, Instruction Tuning, RLHF/DPO). • Kenntnisse zu RNNs und CNNs sind von Vorteil, stellen jedoch keine Kernanforderung dar. • Erfahrung im Training und Fine-Tuning von LLMs sowie beim Aufbau von RAG- und agentbasierten Systemen, einschließlich Orchestrierungs-Frameworks (LangChain, LlamaIndex, LangGraph), Vektor-Datenbanken (z. B. Qdrant, Weaviate, pgvector) und Tool-/Function-Calling. • Erfahrung mit Experimentier- und Tracking-Tools: Jupyter Notebooks sowie Experiment- und Prompt-Tracking (MLflow, Weights & Biases) und LLM-Evaluierung (z. B. Ragas, LangSmith/Langfuse, eigene Evaluierungsharnesses). • Vertrautheit mit Cloud-Plattformen (AWS, Azure, Google Cloud) und deren AI-Services, mit Schwerpunkt auf Google Cloud (Vertex AI, Model Garden, Managed Endpoints). • Erfahrung in der produktiven Bereitstellung selbstgehosteter und mit offenen Gewichten versehener LLMs mithilfe von Serving-Frameworks wie vLLM, TGI, Ollama oder llama.cpp sowie Bewusstsein für GPU-Sizing, Quantisierungsformate (GGUF, AWQ, GPTQ) und On-Prem- oder Air-Gapped-Anforderungen. • Praktische Kenntnisse in MLOps/LLMOps und DevOps-Praktiken: Git, CI/CD, Containerisierung (Docker, Kubernetes) sowie Telemetrie, Monitoring und Observability für Modell- und Inferenzleistung. • Ausgezeichnete analytische und problemlösende Fähigkeiten sowie die Fähigkeit, innovative Lösungen für komplexe Probleme zu entwerfen. • Erfahrung oder Bewusstsein für KI-Ethik, Fairness und Strategien zur Bias-Minderung im Kontext von NLP und LLMs. • Starke mündliche und schriftliche Kommunikationsfähigkeiten mit der Fähigkeit, komplexe technische Konzepte für nicht-technische Stakeholder verständlich zu machen. • Fähigkeit, effektiv in einem kollaborativen, funktionsübergreifenden Teamumfeld zu arbeiten. • Hohe Aufmerksamkeit für Details und Verpflichtung zur Sicherstellung der Genauigkeit und Qualität der Arbeit. • Fähigkeit, in einem schnelllebigen, dynamischen Umfeld zu arbeiten und mehrere Projekte gleichzeitig zu managen.

🏖️ Vorteile

• Hervorragendes Arbeitsumfeld und die Möglichkeit, echte Auswirkungen in der Welt zu erzielen • Ein wirklich High-Tech-, hochmodernes Engineering-Unternehmen mit flacher Struktur und wenig Politik • Arbeit mit den neuesten Technologien in Data & AI, einschließlich Edge AI und Swarming – sowohl innerhalb unserer Softwareplattformen als auch in unseren eingebetteten Board-Systemen • Flexible Arbeitsmodelle • Möglichkeiten zur beruflichen Weiterentwicklung • Kollaboratives und inklusives Arbeitsumfeld • Gehalt entsprechend dem Niveau nachgewiesener Erfahrung

Jetzt Bewerben

Ähnliche Jobs

🕒 vor 28 Tagen

BlueThrone

51 - 200

👥 B2C

Leiter Analytics, verantwortlich für Messung und Analyse des profitablen Mobile-App-Portfolios von BlueThrone. Führt praxisorientierte Analytics-Arbeit, leitet das BI-Team und arbeitet bereichsübergreifend zur Performance-Optimierung.

🌏 Überall auf der Welt

💰 Seed im 2022-04

⏰ Vollzeit

🟠 Senior

📊 Data Scientist

🗣️🇺🇸🇬🇧 Englisch erforderlich