Infrastruktur-Engineer

Stelle nicht auf LinkedIn

🔥 vor 45 Minuten

🗣️🇺🇸🇬🇧 Englisch erforderlich

Jetzt Bewerben
Ähnliche Remote-Jobs finden

📊 Überprüfen Sie Ihre Lebenslauf-Bewertung für diese Stelle

Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

Logo of Orcrist Technologies GmbH

Orcrist Technologies GmbH

11 - 50 Mitarbeiter

🤖 Künstliche Intelligenz

🏢 Unternehmen

🏛️ Regierung

Artificial Intelligence • Enterprise • Government

Orcrist Technologies GmbH ist ein Unternehmen, das Intelligence-Fusion- und Entscheidungsunterstützungslösungen für komplexe Umgebungen entwickelt. Es kombiniert fortschrittliche Analytik und KI, um Organisationen zu helfen, Unsicherheiten in strategische Vorteile zu verwandeln. Das Unternehmen legt den Schwerpunkt auf Angebote für Unternehmen und die Regierung und positioniert sich als Anbieter von KI-gesteuerter Betriebsintelligenz und präzisen Entscheidungswerkzeugen für den öffentlichen Sektor und Anwendungsfälle großer Organisationen.

Beschreibung

• Entwerfen, dimensionieren, bereitstellen und betreiben von Bare‑Metal‑GPU‑Server‑Fleets in vor Ort (on‑prem) und netzisolierten (air‑gapped) Umgebungen (Firmware/BIOS, BMC über Redfish/IPMI, OS, Treiber) mit Zero‑Touch‑Provisioning (PXE/iPXE, MAAS/Metal3/Tinkerbell) und Automatisierung (Ansible/Salt, Terraform/Pulumi). • Verantwortlich für den kompletten NVIDIA‑GPU‑Stack: Treiber, CUDA, GPU Operator, Container Toolkit, MIG und DCGM, optimiert für Inferenz‑Durchsatz, Latenz und Auslastung. • Aufbau des Bare‑Metal‑Substrats, auf dem Kubernetes läuft: Node‑Lifecycle, Container‑Runtime, GPU‑Device‑Plugins, Node‑Feature‑Discovery sowie Kernel‑/NUMA‑Tuning. • Konzeption und Umsetzung von Rechenzentrums‑Netzwerken und resilientem Storage (VLANs/Switching, RDMA, Ceph/ZFS/NVMe), skalierbar ohne Austausch des Cores, mit Verschlüsselung at rest. • Zusammenarbeit mit ML‑ und MLOps‑Teams bei On‑Prem‑Inference‑Serving (Triton, KServe, vLLM): Modell‑Deployment, GPU‑Scheduling und ‑Sharing sowie Performance‑Tuning. • Planung und Durchführung von On‑Site‑Buildouts: Rack‑Integration, Dimensionierung von Strom/USV und Kühlung, Inbetriebnahme, Kapazitätsplanung, Runbooks und Übergabe an den Betreiber.

🎯 Anforderungen

• Mindestens 5 Jahre Erfahrung in Bare‑Metal, HPC/GPU, Rechenzentrums‑ oder Systeminfrastruktur‑Engineering mit praktischer Verantwortung für physische und Compute‑Infrastruktur. • Fundierte Kenntnisse in Bare‑Metal‑Linux (RHEL/Rocky/Ubuntu): Firmware, BMC, PXE, Kernel‑ und Storage‑Tuning sowie solide Grundlagen in Netzwerk‑ und Storage‑Technologien. • Nachweisliche Erfahrung mit dem NVIDIA‑GPU‑Stack (Treiber, CUDA, GPU Operator, MIG, DCGM) und dem produktiven Betrieb von GPU‑basierten Modellen. • Sicherer Umgang mit netzisolierten (air‑gapped) oder vor Ort betriebenen Umgebungen sowie Reisebereitschaft zu Kundenstandorten für Aufbau und Deployments. • Dokumentationsorientiert, methodisch und ruhig im Umgang mit Hardware‑Incidents. Berechtigt, in Deutschland zu arbeiten.

🏖️ Vorteile

• Moderne Architektur und Stack. • Remote‑first in Deutschland mit gelegentlichen Team‑Events in Berlin. • Home‑Office‑Budget und hervorragende Ausstattung. • 30 Tage Urlaub. • Direkter Einfluss auf kritische Missionen bei Kunden aus dem privaten und öffentlichen Sektor.

Jetzt Bewerben

Ähnliche Jobs

🕒 vor 5 Tagen

Jedox

501 - 1000

☁️ SaaS

💸 Finanzen

🏢 Unternehmen

Ingenieur für Cloud-Infrastruktur (AI & Automation) zur Entwicklung der unternehmenseigenen AI-Cloud-Plattform. Entwurf und Betrieb robuster Cloud-Infrastrukturen für AI-, ML- und GenAI-Workloads.

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 1 Monat

ALTEN

10.000+ Mitarbeiter

🚀 Luft- und Raumfahrt

Storage-/Infrastructure-Spezialist, der die operative Stabilität und hohe Verfügbarkeit von IT-Infrastrukturen in Deutschland sicherstellt. Aufgaben: Analyse von Störungen, Leistungsüberwachung und Kapazitätsmanagement.

🕒 vor 5 Monaten

Mitratech

1001 - 5000

📋 Compliance

☁️ SaaS

Senior Infrastructure Engineer spezialisiert auf AI/ML-Infrastruktur bei Mitratech, verantwortlich für das Design und die Optimierung von AWS-Umgebungen für komplexe Workloads. Zusammenarbeit mit ML-Teams zur Verbesserung der Modellleistung und der Sicherheitspraktiken.

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 6 Monaten

Famedly GmbH

11 - 50

☁️ SaaS

🤝 B2B

🔐 Sicherheit

Infrastructure Engineer bei Famedly, tätig an sicherer digitaler Kommunikation im Gesundheitswesen. Konfiguration und Administration von Linux-Servern, Systemintegration und Entwicklung von Automatisierungen.

🇩🇪 Deutschland – Remote

💵 €45.000 - €58.000 / Jahr

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

👷 IT-Infrastrukturingenieur

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 7 Monaten

Xebia

5001 - 10000

🏢 Unternehmen

🤖 Künstliche Intelligenz

☁️ SaaS

Azure Infrastructure Architekt verantwortlich für die Implementierung von Azure-Cloud-Lösungen für unterschiedliche Kunden. Beratung zu Compliance und Automatisierung sowie enge Zusammenarbeit mit Entwicklungsteams.

Azure

Cloud

Firewalls