Senior Site Reliability Engineer

🕒 vor 1 Monat

🗣️🇺🇸🇬🇧 Englisch erforderlich

Jetzt Bewerben
Ähnliche Remote-Jobs finden

📊 Überprüfen Sie Ihre Lebenslauf-Bewertung für diese Stelle

Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

Logo of Parallel Domain

Parallel Domain

51 - 200 Mitarbeiter

🤖 Künstliche Intelligenz

🔌 API

💰 €30.000.000 Series B im 2022-11

Artificial Intelligence • API • Automotive

Parallel Domain ist ein Unternehmen, das eine API für Machine-Learning-, Computer-Vision- und Perception-Teams anbietet, um hochpräzise, realitätsnahe synthetische Sensordaten – darunter Kamera-, LiDAR- und Radar-Daten – zu generieren. Diese Daten unterstützen das Training und Testen von Perception-Modellen, indem Szenarien in prozedural generierten Welten oder Repliken beliebiger realer Orte simuliert werden. Die Plattform stellt hochwertige synthetische Daten bereit, um Perception-Modelle zu analysieren, zu trainieren, zu evaluieren und zu überwachen, steigert die Zuverlässigkeit von AI und reduziert gleichzeitig Risiken, Entwicklungszeit und Kosten. Parallel Domain unterstützt vielfältige Perception-Anwendungsfälle in verschiedenen Branchen, etwa Automotive und Drohnen, durch die Bereitstellung vielfältiger Datensätze mit Edge Cases und präzisen Annotationen. Dadurch wird die Performance von Machine-Learning-Modellen bei Aufgaben wie der Erkennung von Einsatzfahrzeugen und der Klassifikation von Ampelsignalen deutlich verbessert.

Beschreibung

• Design, build, and maintain multi-region AWS infrastructure using Terraform. • Operate and scale EKS clusters across production regions: autoscaling, node lifecycle, workload health. • Manage networking across environments: VPC design, DNS, load balancing, and cross-region connectivity. • Support infrastructure changes, migrations, and expansions into new regions. • Help build and run incident management processes: severity definitions, escalation paths, on-call practices. • Lead incident response, debugging, and root-cause analysis. • Write postmortems and drive systemic reliability improvements from what they surface. • Improve observability across metrics, logging, tracing, and dashboards. • Provide security-conscious feedback on platform architecture decisions. • Own cloud IAM governance: roles, policies, and access boundaries across accounts and services. • Improve CI/CD pipelines and infrastructure validation. • Support engineers with infrastructure debugging, environment setup, and performance issues. • Contribute to tooling and automation in Python and Bash.

🎯 Anforderungen

• 5+ years in SRE, DevOps, or infrastructure engineering roles, with a track record of operating production systems across multiple regions. • Terraform experience: Modules, state management, and multi-environment patterns. • AWS depth: Solid experience across VPC, IAM, EKS, S3, and CloudWatch. • Kubernetes expertise: Cluster operations, autoscaling, RBAC, and Helm. • CI/CD and GitOps: Experience with GitHub Actions, ArgoCD, or similar workflows. • Networking fundamentals: CIDR, DNS, load balancing, VPN, and cross-region connectivity. • Observability: Experience with tooling such as Prometheus and Grafana. • Scripting: Comfort with Python and Bash for tooling and automation. • Cross-platform familiarity: Working knowledge of both Linux and Windows environments. Operational experience supporting Windows-based workloads is a meaningful advantage. • Pragmatism and ownership: Comfortable in a fast-moving startup with evolving priorities. You take ownership of systems while collaborating closely with other teams, and you're pragmatic about tradeoffs between speed, reliability, and complexity.

🏖️ Vorteile

• equity • full health/dental/vision coverage • learning stipend • generous vacation

Jetzt Bewerben

Ähnliche Jobs

🕒 vor 1 Monat

Nomi Health

501 - 1000

⚕️ Krankenversicherung

💸 Finanzen

☁️ SaaS

Senior Manager of Cloud and DevOps Engineering managing daily operations of AWS and Kubernetes infrastructure across businesses. Leading a team and working closely with senior leadership for operational excellence.

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 1 Monat

Sagent

201 - 500

☁️ SaaS

💳 Fintech

Cloud Infrastructure Engineer managing cloud resources for large-scale infrastructure. Supporting development teams in a microservices environment to streamline deployments and optimize performance.

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 1 Monat

Veeam Software

1001 - 5000

☁️ SaaS

🔒 Cybersecurity

🏢 Unternehmen

Senior Site Reliability Engineer for Veeam's Government & Sovereign Cloud environments. Building a global SRE function with an emphasis on high availability and operational excellence.

🇺🇸 Vereinigte Staaten – Remote

💵 $138.900 - $231.400 / Jahr

💰 €500.000.000 Private Equity Round im 2019-01

⏰ Vollzeit

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🦅 H1B-Visum-Sponsor

info

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 1 Monat

ImmunityBio, Inc.

501 - 1000

🧬 Biotechnologie

⚕️ Krankenversicherung

💊 Pharmazie

DevOps Engineer bridging software development and operations at ImmunityBio, involved in CI/CD and infrastructure automation. Collaborating across teams to support reliable and scalable services.

🇺🇸 Vereinigte Staaten – Remote

💵 $130.500 - $150.000 / Jahr

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 1 Monat

Tiger Resourcing Group

11 - 50

🎯 Rekrutierung

🤝 B2B

Experienced DevOps Engineer responsible for building and maintaining cloud infrastructure. Expertise required in AWS, Azure, CI/CD, Kubernetes, and microservices environment.

🇺🇸 Vereinigte Staaten – Remote

💵 €275 - €325 / Jahr

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich