AI Infrastructure, Platform Operations Engineer

🔥 il y a 1 heure

🇪🇺 Europe – Télétravail

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

🏗️ Ingénieur Plateforme

🗣️🇺🇸🇬🇧 Anglais requis

Postuler Maintenant
Trouver des Emplois à Distance Similaires

📊 Vérifiez votre score de CV pour ce poste

Améliorez vos chances d'obtenir un entretien en vérifiant votre score de CV avant de postuler.

Logo of Mirantis

Mirantis

501 - 1000 employés

🏢 Entreprise

☁️ SaaS

Cloud Computing • Enterprise • SaaS

Mirantis est une entreprise spécialisée dans la gestion de conteneurs et les solutions d'infrastructure cloud. Elle propose une gamme de produits, notamment Mirantis Kubernetes Engine (MKE), Mirantis OpenStack pour Kubernetes (MOSK) et Mirantis Container Cloud (MCC), qui offrent des plateformes de gestion de Kubernetes et de conteneurs de niveau entreprise. Mirantis développe également des outils pour des chaînes d'approvisionnement logicielles sécurisées, tels que le Mirantis Container Runtime (MCR) et le Mirantis Secure Registry (MSR). En tant que défenseur des technologies open source, Mirantis soutient divers projets et fournit des ressources comme Lens Desktop, un IDE Kubernetes populaire, et un support technique pour les entreprises adoptant des technologies cloud-natives. Leurs solutions s'adressent à des secteurs tels que les services publics, les services financiers et les industries des services technologiques et SaaS au sens large.

Description

• Monitor, operate, and support production AI infrastructure platforms. • Investigate and resolve infrastructure, networking, hardware, and platform-related incidents. • Support NVIDIA GPU infrastructure and associated platform services. • Monitor and troubleshoot Kubernetes-based environments. • Investigate performance, availability, and reliability issues across infrastructure and platform components. • Collaborate with engineering teams, hardware vendors, datacenter personnel, and service delivery teams to resolve technical issues. • Participate in incident response, root cause analysis, and operational improvement activities. • Contribute to improvements in monitoring, observability, automation, and operational processes. • Maintain operational documentation, runbooks, and knowledge articles.

🎯 Exigences

• 3+ years of experience in infrastructure operations, platform operations, network operations, site reliability engineering, cloud operations, datacenter operations, or related technical roles. • Strong Linux administration and troubleshooting skills. • Good understanding of networking concepts and experience diagnosing infrastructure-related issues. • Working knowledge of Kubernetes in production environments. • Experience supporting production infrastructure and services. • Strong analytical and problem-solving skills. • Experience working within structured operational and incident management processes. • Excellent communication and collaboration skills. • Ability to work within a shift-based operational environment. • Experience in one or more of the following areas is highly desirable: NVIDIA GPU infrastructure and accelerated computing platforms. • InfiniBand networking and NVIDIA UFM. • Kubernetes platform operations. • AI infrastructure or HPC environments. • Site Reliability Engineering (SRE) or Platform Engineering. • Observability platforms such as Grafana, Prometheus, ELK, or OpenTelemetry. • Infrastructure automation technologies and Infrastructure-as-Code practices. • Large-scale distributed systems and production platforms.

🏖️ Avantages

• Work with some of the most advanced AI infrastructure environments in production today. • Gain exposure to NVIDIA GPU technologies, Kubernetes platforms, and high-performance networking environments. • Help define how next-generation AI infrastructure is operated and supported. • Be part of a team shaping the future of AI-powered operations through k0rdent AI. • Join a growing organisation investing heavily in AI infrastructure and platform services.

Postuler Maintenant

Emplois Similaires

🕒 il y a 7 jours

Vira Games

51 - 200

🎮 Jeux vidéo

👥 B2C

Ingénieur plateforme senior concevant et développant des services backend pour une entreprise de jeux vidéo. Focalisé sur l'architecture de la plateforme GaaS, l'assurance qualité et les solutions d'infrastructure.

🇪🇺 Europe – Télétravail

⏰ Temps Plein

🟠 Senior

🏗️ Ingénieur Plateforme

🗣️🇺🇦 Ukrainien requis

🕒 il y a 1 mois

bloomon

51 - 200

🛒 Commerce de détail

🛍️ eCommerce

Ingénieur plateforme intervenant sur plusieurs domaines technologiques chez Bloom & Wild. Amélioration des solutions e‑commerce, data et infrastructure avec un accent sur l'autonomie et l'innovation.

🇪🇺 Europe – Télétravail

💰 Series C en 2019-03

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

🏗️ Ingénieur Plateforme

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 1 mois

saas.group

51 - 200

☁️ SaaS

🏢 Entreprise

🤝 B2B

Ingénieur Plateforme Senior pour ScraperAPI, gestion et consolidation de l'infrastructure pour des solutions de web scraping haute performance. Collaboration avec les équipes d'ingénierie pour impulser des améliorations significatives de la plateforme.

🇪🇺 Europe – Télétravail

⏰ Temps Plein

🟠 Senior

🏗️ Ingénieur Plateforme

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 3 mois

TD SYNNEX

10 000+ employés

🏢 Entreprise

☁️ SaaS

📡 Télécommunications

Ingénieur Plateforme Senior concevant une infrastructure multi-cloud pour des applications axées sur l’IA chez TD SYNNEX. Axé sur l’automatisation et la collaboration entre les équipes Développement, Métier et Opérations.

🇪🇺 Europe – Télétravail

⏰ Temps Plein

🟠 Senior

🏗️ Ingénieur Plateforme

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 3 mois

Polar

1 - 10

💳 Fintech

☁️ SaaS

🔌 API

Ingénieur plateforme senior concevant et faisant évoluer la plateforme Polar pour des startups à forte vélocité. Conception de systèmes axés sur la fiabilité et l'évolutivité des flux financiers à travers plusieurs couches d'ingénierie.

🇪🇺 Europe – Télétravail

⏰ Temps Plein

🟠 Senior

🏗️ Ingénieur Plateforme

🗣️🇺🇸🇬🇧 Anglais requis