Senior Site Reliability Engineer

Ähnliche Remote-Jobs finden

501 - 1000 Mitarbeiter

👥 HR Tech

☁️ SaaS

🏢 Unternehmen

HR Tech • SaaS • Enterprise

Remote ist eine globale HR-Plattform, die den Prozess der Einstellung, des Onboardings, der Verwaltung und der Bezahlung von Mitarbeitenden und Auftragnehmern weltweit vereinfacht. Sie bietet umfassende Lösungen für Recruiting, Payroll-Management, Contractor-Management und Compliance. Die Plattform unterstützt Unternehmen bei der nahtlosen und effizienten Abwicklung von HR-Aufgaben, sorgt für schnelle und konforme Auszahlungen, stellt Employer-of-Record (EOR)-Services bereit und erleichtert Mitarbeiterbenefits sowie Equity-Programme. Darüber hinaus integriert sich Remote in verschiedene HR-Systeme und ermöglicht so eine flexible, skalierbare und zuverlässige Lösung für Unternehmen, die global expandieren möchten.

Senior Site Reliability Engineer

🔥 vor 4 Minuten

🇪🇺 Europa – Remote

💵 $53.300 - $119.850 / Jahr

⏰ Vollzeit

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

AWS

Cloud

Docker

Grafana

Kubernetes

Prometheus

Terraform

Jetzt Bewerben

📊 Überprüfen Sie Ihre Lebenslauf-Bewertung für diese Stelle

Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

Remote

501 - 1000 Mitarbeiter

👥 HR Tech

☁️ SaaS

🏢 Unternehmen

HR Tech • SaaS • Enterprise

Beschreibung

• Als Senior SRE bei Remote arbeiten Sie mit hoher Eigenverantwortung an komplexen Zuverlässigkeits- und Plattformproblemen und übernehmen die Planung sowie Umsetzung von Features und Projekten innerhalb unseres SRE/Platform-Bereichs. • Sie tragen zur Architektur und Zuverlässigkeitsstrategie der Plattform bei, übersetzen vage Anforderungen in robuste, wartbare Lösungen und heben die technische Qualität der umgebenden Ingenieur:innen, während Sie eng mit Produkt- und Sicherheitsteams in einer asynchron-priorisierten, vollständig remote arbeitenden Umgebung zusammenarbeiten. • Sie arbeiten im Alltag KI-nativ und entwickeln wiederverwendbare KI-Workflows, die das gesamte Team schneller und zuverlässiger machen — nicht nur Sie selbst. • Leiten Sie die Lösungsfindung und -umsetzung für Zuverlässigkeits- und Infrastrukturprobleme mit echter Unklarheit, Komplexität oder hohem Umfang. Arbeiten Sie eigenständig und koordinieren Sie sich bei Bedarf mit anderen Beitragenden. • Tragen Sie zur Architektur, zu Tooling und zur Roadmap der Plattform bei. Beeinflussen Sie Teamprioritäten und setzen Sie sich für technische Initiativen ein. • Helfen Sie mit, Zuverlässigkeitspraktiken für unsere Plattform zu definieren und zu betreiben: SLOs/SLIs, Error Budgets, Alerting und Observability. Übernehmen Sie Verantwortung für die operative Ausrichtung des Teams und nutzen Sie Support-/Incident-Metriken zur Gestaltung der technischen Strategie. • Lösen Sie teamübergreifende Anfragen, identifizieren Sie systemische Probleme und verwandeln Sie wiederkehrende Fälle in wiederverwendbare Fixes und Runbooks statt in einmalige Antworten. • Arbeiten Sie KI-nativ und operationalisieren Sie diese für das Team: Verwenden Sie agentenbasierte Workflows als Standard; erstellen Sie wiederverwendbare Prompts, Skills und Tools, die im Code-Repository eingebettet sind, damit andere schneller und sicherer liefern können; entwerfen Sie agentenbereite Systeme (saubere Schnittstellen, gute Observability), die KI-unterstützte Änderungen leicht überprüfbar machen. Etablieren Sie gemeinsame Standards und domänenweite Schutzmechanismen (secure-by-default-Muster, CI-Schutzmechanismen, KI-unterstützte Review-Praktiken). • Als Mentor:in fungieren und weniger erfahrenen Ingenieur:innen zeitnahes, umsetzbares Feedback geben; an Einstellung, Onboarding und RFC-Diskussionen teilnehmen. • Mit Security zusammenarbeiten, um die Plattform zu härten und Bedrohungen zu mindern; zur Kapazitäts- und Kosten-Effizienz der Infrastruktur beitragen. • Teilnahme an Incident-Response- und On-Call-Rotationen, um Probleme zügig zu lösen und die Systemzuverlässigkeit aufrechtzuerhalten.

🎯 Anforderungen

• Fundierte Berufserfahrung in SRE, DevOps oder Platform Engineering. • Fundierte praktische Erfahrung mit Kubernetes: Betrieb und Skalierung von Produktions-Clustern sowie Container-Tooling (Docker) und dessen Ökosystem. • Erfahrung im Aufbau und Betrieb von Cloud-Infrastruktur auf AWS (oder vergleichbar). • Umfassende Praxis mit Infrastructure as Code, insbesondere Terraform. • Erfahrung mit Zuverlässigkeitsframeworks: SLOs, SLIs, Error Budgets, Alerting-Strategien. • Solider Hintergrund in Observability: OpenTelemetry, Grafana/Prometheus oder Ähnliches. • Versiert im Umgang mit CI/CD (GitLab CI, GitHub Actions oder vergleichbar) und Deployment-Automatisierung. • Sicherer Umgang mit Golang und Bash/Scripting; Kenntnisse in weiteren Programmiersprachen sind von Vorteil. • Praktische, eingebettete Nutzung von KI in Infrastruktur-/Ops-/Entwicklungsaufgaben, agentenbasierte Workflows mit konkreten, beobachtbaren Ergebnissen — nicht nur Tool-Vertrautheit. • Klare und durchdachte Kommunikation, besonders in einer asynchron-priorisierten, globalen Umgebung. • Proaktiv, neugierig und bereit, Verantwortung für Herausforderungen zu übernehmen. • Teamorientiert und respektvoll im Umgang mit verschiedenen Kulturen, Zeitzonen und Hintergründen.

🏖️ Vorteile

• Arbeiten von überall • Flexible bezahlte Freistellung • Flexible Arbeitszeiten (wir arbeiten asynchron) • 16 Wochen bezahlte Elternzeit • Angebote zur Unterstützung der psychischen Gesundheit • Aktienoptionen • Weiterbildungsbudget • Budget für Home-Office und IT-Ausstattung • Budget für lokale Präsenz-Events oder Co-Working-Spaces

Jetzt Bewerben

Ähnliche Jobs

DevOps Engineer

🕒 vor 7 Tagen

Traffic Label Limited

11 - 50

🤝 B2B

📱 Medien

DevOps Engineer (Mid-Level) bei Traffic Label zur Unterstützung und Optimierung der Cloud-Infrastruktur und CI/CD-Pipelines. Zusammenarbeit mit Entwicklungsteams zur Sicherstellung operativer Exzellenz und Automatisierung.

🇪🇺 Europa – Remote

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

Ansible

AWS

Cloud

Docker

Google Cloud Platform

Kafka

Kubernetes

Postgres

Prometheus

Python

Terraform

Site Reliability Engineer

🕒 vor 1 Monat

Alpaca

201 - 500

🔌 API

💳 Fintech

₿ Crypto

Site Reliability Engineer bei Alpaca, der die Zuverlässigkeit der Brokerage-Plattform über Cloud-Infrastruktur sicherstellt. Schwerpunkt auf PostgreSQL-Zuverlässigkeit und Observability in einem globalen Engineering-Team.

🇪🇺 Europa – Remote

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

Cloud

DNS

Kubernetes

Linux

Postgres

Python

Reliability Engineer (w/m/d)

🕒 vor 1 Monat

IONITY

51 - 200

Reliability Engineer, der Qualitätsprobleme in Lade-Netzwerken für Elektrofahrzeuge bei IONITY analysiert und behebt. Zusammenarbeit mit Stakeholdern zur Sicherstellung der Systemleistung und Unterstützung bei Software-Releases.

🇪🇺 Europa – Remote

💰 Venture Round im 2021-11

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

Senior Service-Desk-Zuverlässigkeitsingenieur – SDRE

🕒 vor 1 Monat

Tabby

201 - 500

💳 Fintech

🛍️ eCommerce

Senior Service-Desk-Zuverlässigkeitsingenieur bei Tabby, verantwortlich für SRE- und Terraform-Aufgaben, zur Unterstützung eines globalen Engineering-Teams.

🇪🇺 Europa – Remote

💰 €58.000.000 Series C im 2023-01

⏰ Vollzeit

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

BigQuery

Cloud

Google Cloud Platform

Kubernetes

Python

Terraform

Senior ServiceDesk Reliability Engineer – SDRE

🕒 vor 2 Monaten

Tabby

201 - 500

💳 Fintech

🛍️ eCommerce

Senior ServiceDesk Reliability Engineer at Tabby, a fintech unicorn. Collaborating within an international engineering team to enhance service reliability.

🇪🇺 Europa – Remote

💰 €58.000.000 Series C im 2023-01

⏰ Vollzeit

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

BigQuery

Cloud

Google Cloud Platform

Python

Terraform