HPC Specialist, Solutions Architect

Stelle nicht auf LinkedIn

🕒 vor 4 Monaten

🇺🇸 Vereinigte Staaten – Remote

💵 $225.000 - $315.000 / Jahr

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

💻 Lösungsingenieur

🗣️🇺🇸🇬🇧 Englisch erforderlich

Jetzt Bewerben
Ähnliche Remote-Jobs finden

📊 Überprüfen Sie Ihre Lebenslauf-Bewertung für diese Stelle

Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

Logo of Nebius Group

Nebius Group

1001 - 5000 Mitarbeiter

🏢 Unternehmen

☁️ SaaS

AI • Enterprise • SaaS

Die Nebius Group baut eines der weltweit führenden Unternehmen für KI-Infrastruktur auf und konzentriert sich darauf, die notwendige Rechenleistung, Speicherkapazität und Tools für Entwickler im KI-Bereich bereitzustellen. Mit Sitz in Europa und an der Nasdaq notiert verfügt Nebius über eine globale Präsenz mit F&E-Zentren in Europa, Nordamerika und Israel. Das zentrale Angebot des Unternehmens ist eine KI-zentrierte Cloud-Plattform, die für rechenintensive KI-Workloads ausgelegt ist, ergänzt durch verschiedene weitere Geschäftsbereiche in den Bereichen Generative KI, Edtech und autonome Technologien.

Beschreibung

• Architect and implement scalable HPC clusters optimized for AI, simulation, and distributed training, leveraging container orchestration frameworks and schedulers (e.g., Kubernetes, Slurm). • Design and integrate GPU-accelerated compute infrastructures featuring NVIDIA Hopper, Blackwell architectures, NVLink/NVSwitch, and InfiniBand/RoCE Interconnects. • Deploy, and manage GPU Operator and Network Operator stacks for automated lifecycle management of GPU and high-speed networking components. • Design and validate cloud HPC environments, focusing on low-latency, high-bandwidth networking, multi-GPU scaling, and efficient workload scheduling. • Lead reference architectures for AI/ML model training, data pipelines, and MLOps integrations using modern observability and CI/CD tooling. • Collaborate with hardware vendors (e.g., NVIDIA) and cloud providers to evaluate and optimize emerging HPC and GPU technologies. • Benchmark system performance, identify bottlenecks, and tune resource utilization across compute, network, and storage tiers. • Provide expert-level technical guidance to customers, internal teams, and partners on HPC architecture patterns, operational excellence reviews and customer engagements

🎯 Anforderungen

• Bachelor’s or Master’s degree in Computer Science, Engineering, or a related field (Ph.D. a plus) • 3+ years of hands-on experience architecting HPC or large-scale GPU clusters. • Expertise in Linux systems, Kubernetes, container runtimes (containers, CRI-O, Docker), and related CI/CD practices. • Strong understanding of HPC networking protocols and RDMA stacks (InfiniBand, NVLink/NVSwitch) • Deep understanding of storage and I/O optimization for large datasets (Ceph, Lustre, NFS, GPUDirect Storage) • Familiarity with Terraform, Ansible, Helm, and GitOps workflows. • Strong scripting skills in Python or Bash for automation and tool integration. • Excellent communication and documentation skills; ability to lead design reviews and customer engagements.

🏖️ Vorteile

• Health Insurance: 100% company-paid medical, dental, and vision coverage for employees and families. • 401(k) Plan: Up to 4% company match with immediate vesting. • Parental Leave: 20 weeks paid for primary caregivers, 12 weeks for secondary caregivers. • Remote Work Reimbursement: Up to $85/month for mobile and internet. • Disability & Life Insurance: Company-paid short-term, long-term, and life insurance coverage.

Jetzt Bewerben

Ähnliche Jobs

🕒 vor 4 Monaten

NVIDIA

10.000+ Mitarbeiter

🤖 Künstliche Intelligenz

🎮 Gaming

Solutions Architect at NVIDIA supporting innovative companies in AdTech and Media. Collaborating with teams to optimize workflows and drive technology adoption with advanced computing.

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 4 Monaten

Aquila

1001 - 5000

☁️ SaaS

🏢 Unternehmen

Software Implementation Consultant for treasury management at SymPro, helping public sector clients manage financial workflows. Leading software implementations and providing training and ongoing support.

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 4 Monaten

KnowBe4

1001 - 5000

🔒 Cybersecurity

☁️ SaaS

📚 Bildung

Solution Architect designing integrations and architecture for Salesforce and other SaaS platforms. Leading AI/ML strategy and collaborating with teams on technical designs.

🇺🇸 Vereinigte Staaten – Remote

💵 $150.000 - $170.000 / Jahr

⏰ Vollzeit

🟠 Senior

🔴 Experte

💻 Lösungsingenieur

🦅 H1B-Visum-Sponsor

info

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 4 Monaten

Solutions Engineer providing technical solutions and support in the cybersecurity sector. Collaborating with sales to meet customer needs and enhance product implementation.

🇺🇸 Vereinigte Staaten – Remote

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

💻 Lösungsingenieur

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 4 Monaten

First Quality

1001 - 5000

⚕️ Krankenversicherung

🛒 Einzelhandel

⚡ Produktivität

Solution Engineer designing, building, and deploying IT infrastructure for First Quality's data center services. Collaborating with team members and ensuring high-quality service delivery.

🗣️🇺🇸🇬🇧 Englisch erforderlich

Cloud

DNS

ITSM

Linux

Terraform

VMware