Senior HPC Cluster Engineer

Emploi pas sur LinkedIn

🕒 il y a 1 mois

🇺🇸 États-Unis – Télétravail

💵 $170 000 - $300 000 / an

⏰ Temps Plein

🟠 Senior

👷🏻‍♀️ Ingénieur

🗣️🇺🇸🇬🇧 Anglais requis

Postuler Maintenant
Trouver des Emplois à Distance Similaires

📊 Vérifiez votre score de CV pour ce poste

Améliorez vos chances d'obtenir un entretien en vérifiant votre score de CV avant de postuler.

Logo of Nebius Group

Nebius Group

1001 - 5000 employés

🏢 Entreprise

☁️ SaaS

AI • Enterprise • SaaS

Le groupe Nebius construit l’une des principales entreprises d’infrastructure AI au monde, en se concentrant sur la fourniture de la puissance de calcul, du stockage et des outils nécessaires aux développeurs dans le domaine de l’AI. Basée en Europe et cotée au Nasdaq, Nebius dispose d’une présence mondiale avec des centres de R&D en Europe, en Amérique du Nord et en Israël. L’offre principale de l’entreprise est une plateforme cloud centrée sur l’AI, conçue pour des workloads AI intensifs, complétée par diverses autres activités impliquées dans le développement de l’AI générative, l’edtech et les technologies autonomes.

Description

• Tuning the performance of GPU clusters and InfiniBand networks to ensure optimal operation in HPC and GPU-based environments. • Analyzing and troubleshooting the root cause of issues related to GPUs and InfiniBand networks, and proposing corrective actions. • Integrating new hardware into the existing infrastructure, including support for new GPU hardware through software stacks like Kubernetes, QEMU, and KVM. • Enhancing automation systems for proactive monitoring, detecting, and resolving issues in GPU and InfiniBand environments. • Configuring and managing GPU devices and InfiniBand fabrics, ensuring efficient and reliable operation.

🎯 Exigences

• 5+ years of professional experience in system-level software development (focused on performance optimization, low-level programming). • 3+ years of hands-on experience with Linux systems (administration, troubleshooting, and performance tuning). • In-depth understanding of server architecture, including PCIe devices, NICs, Linux OS/Kernel, and high-performance computing (HPC) systems. • Strong proficiency in one or more performance-oriented programming languages (C/C++, Go, Python).

🏖️ Avantages

• Competitive salary and comprehensive benefits package. • Opportunities for professional growth within Nebius. • Flexible working arrangements. • A dynamic and collaborative work environment that values initiative and innovation.

Postuler Maintenant

Emplois Similaires

🕒 il y a 1 mois

DigitalOcean

1001 - 5000

☁️ SaaS

Hardware Sustaining Engineer at DigitalOcean supporting server infrastructure and troubleshooting hardware issues in a cloud capacity. Collaborating with teams to improve operational standards and drive efficiency.

🇺🇸 États-Unis – Télétravail

💵 $83 000 - $104 000 / an

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

👷🏻‍♀️ Ingénieur

🦅 Parrain de Visa H1B

info

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 1 mois

Founding Engineer role at Hermes Web to develop a polished hosted personal AI agent. Responsibilities include owning product and engineering end-to-end with a focus on consumer-grade polish.

🇺🇸 États-Unis – Télétravail

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

👷🏻‍♀️ Ingénieur

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 1 mois

Ebara Elliott Energy

1001 - 5000

⚡ Énergie

🔧 Matériel

Controls Engineer providing technical advice and analyzing system controls for rotating equipment, including programming. Coordinating with customers and ensuring operation per design standards throughout North America.

🇺🇸 États-Unis – Télétravail

⏰ Temps Plein

🟠 Senior

🔴 Expert

👷🏻‍♀️ Ingénieur

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 1 mois

GCON Inc.

51 - 200

🏠 Immobilier

Project Engineer supporting large-scale data center project in West Texas, focusing on project management and field operations while requiring relocation. Ideal for someone early in their construction career.

🇺🇸 États-Unis – Télétravail

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

👷🏻‍♀️ Ingénieur

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 1 mois

General Dynamics Information Technology

10 000+ employés

🔒 Cybersecurity

🤖 Intelligence artificielle

Wireless Engineer Lead providing technical oversight for engineering and installation across global Air Force and Space Force sites. Responsible for coordinating tasks and ensuring design accuracy in wireless infrastructure.

🗣️🇺🇸🇬🇧 Anglais requis