Senior Software Engineer – AI Middleware

🕒 il y a 2 mois

🤠 Texas – Distant

info

⏰ Temps Plein

🟠 Senior

🧑‍💻 Développeur Full-Stack

🦅 Parrain de Visa H1B

info

🗣️🇺🇸🇬🇧 Anglais requis

Postuler Maintenant
Trouver des Emplois à Distance Similaires

📊 Vérifiez votre score de CV pour ce poste

Améliorez vos chances d'obtenir un entretien en vérifiant votre score de CV avant de postuler.

Logo of Cornelis Networks

Cornelis Networks

51 - 200 employés

🤖 Intelligence artificielle

🔧 Matériel

🏢 Entreprise

💰 €29 000 000 Series B en 2022-11

Artificial Intelligence • Hardware • Enterprise

Cornelis Networks est un fournisseur de premier plan de réseaux interconnectés intelligents, évolutifs et haute performance conçus pour les applications d'IA. L'entreprise se spécialise dans la fourniture de solutions de bout en bout, spécifiquement conçues pour des infrastructures haute performance aux organisations commerciales, scientifiques, académiques et gouvernementales. Les solutions de Cornelis Networks visent à améliorer la performance, l'évolutivité et l'efficacité dans les environnements hyperscale, cloud AI et AI/HPC sur site. Leurs offres sont reconnues pour une architecture évolutive, des solutions à large bande passante et une compatibilité universelle avec les accélérateurs et les GPU. Issue d'un spin-off d'Intel, l'entreprise est positionnée pour défier les technologies existantes comme l'InfiniBand et l'Ethernet, fournissant des réseaux interconnectés avancés qui alimentent l'infrastructure moderne de l'IA.

Description

• Design and implement performance-critical features for CCL enablement on Cornelis Networks’ fabrics • Optimize distributed training performance across multi-node, multi-GPU configurations • Improve GPU communication paths including GPU-direct transfers, IPC, and CPU/GPU synchronization • Profile distributed AI workloads and identify bottlenecks across the software and hardware stack • Tune AI frameworks such as PyTorch Distributed, TensorFlow/XLA, JAX, DeepSpeed, and Megatron-LM • Develop benchmarks and microbenchmarks aligned with real model performance • Contribute upstream to AI communication and distributed training projects • Participate in design reviews, code reviews, CI, and long-term maintenance • Prototype and validate Ultra Ethernet capabilities for AI collective communication • Provide technical input for deployment considerations and performance validation • Collaborate with kernel/driver, switch, performance, and systems teams • Support advanced escalations by analyzing traces and providing robust fixes

🎯 Exigences

• 8+ years of experience in high-performance systems programming in C/C++ on Linux • Strong experience with GPU communication stacks including CUDA/ROCm and NCCL/RCCL • Ability to optimize distributed training performance using profiling and tracing • Understanding of collective communication concepts and topology awareness • Experience delivering production-quality code • Open-source contributions in relevant areas

🏖️ Avantages

• health and retirement benefits • Performance-based incentives including annual bonuses • medical, dental, and vision coverage • disability and life insurance • dependent care flexible spending account • accidental injury insurance • pet insurance • generous paid holidays • 401(k) with company match • Open Time Off (OTO) • sick time • bonding leave • pregnancy disability leave

Postuler Maintenant

Emplois Similaires

🕒 il y a 2 mois

Owens Corning

10 000+ employés

Controls and Automation Project Manager for Owens Corning, leading projects in Robotics and Automation. Responsible for technical depth, project leadership, and team development.

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Clever Real Estate

51 - 200

🏠 Immobilier

🏪 Place de marché

👥 B2C

Full Stack Software Engineer developing backend systems at Clever, a real estate technology company. Shaping the future of the industry through innovative solutions and collaboration.

🇺🇸 États-Unis – Télétravail

💵 $140 000 - $160 000 / an

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

🧑‍💻 Développeur Full-Stack

🦅 Parrain de Visa H1B

info

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Fingerprint

51 - 200

🔒 Cybersecurity

🔌 API

☁️ SaaS

Full Stack Engineer for Fingerprint developing a dashboard for fraud detection. Lead front-end and back-end development tasks in a remote, collaborative environment.

🇺🇸 États-Unis – Télétravail

💰 €32 000 000 Series B en 2021-11

⏰ Temps Plein

🟠 Senior

🔴 Expert

🧑‍💻 Développeur Full-Stack

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Greenlight

201 - 500

💳 Fintech

📚 Éducation

👥 B2C

Senior Software Engineer Full-Stack working on Greenlight's Web Registration flow and maintaining service stability in the fintech app for families.

🇺🇸 États-Unis – Télétravail

💵 $142 000 - $210 000 / an

💰 €260 000 000 Series D en 2021-04

⏰ Temps Plein

🟠 Senior

🧑‍💻 Développeur Full-Stack

🦅 Parrain de Visa H1B

info

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Freenome

201 - 500

🧬 Biotechnologie

🤖 Intelligence artificielle

⚕️ Assurance santé

Software Engineer developing reliable and scalable backend services at Freenome, supporting clinical and R&D labs for early cancer detection.

🇺🇸 États-Unis – Télétravail

💵 $131 325 - $189 525 / an

💰 €290 000 000 Corporate Round en 2022-01

⏰ Temps Plein

🟠 Senior

🧑‍💻 Développeur Full-Stack

🦅 Parrain de Visa H1B

info

🗣️🇺🇸🇬🇧 Anglais requis