Site Reliability Engineer II

🕒 vor 17 Tagen

🇺🇸 Vereinigte Staaten – Remote

⏰ Vollzeit

🟢 Junior

🟡 Mittelstufe

⛑ DevOps- und Site Reliability Engineer (SRE)

🦅 H1B-Visum-Sponsor

info

🗣️🇺🇸🇬🇧 Englisch erforderlich

Jetzt Bewerben
Ähnliche Remote-Jobs finden

📊 Überprüfen Sie Ihre Lebenslauf-Bewertung für diese Stelle

Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

Logo of Backblaze

Backblaze

201 - 500 Mitarbeiter

Gegründet 2007

🛍️ eCommerce

🏢 Unternehmen

💰 €5.000.000 Series A im 2012-07

Cloud Storage • eCommerce • Enterprise

Backblaze ist ein Cloud-Speicherunternehmen, das skalierbare und sichere Datensicherungslösungen sowohl für Unternehmen als auch für Privatpersonen bietet. Ihr B2 Cloud Storage-Service bietet S3-kompatiblen Objektspeicher, der es den Nutzern ermöglicht, ihre Daten mit transparenter Preisgestaltung einfach zu schützen und zu verwalten. Backblaze ist auf automatische und unbegrenzte Backup-Dienste für Computersysteme spezialisiert, um den Benutzern Datensicherheit und Wiederherstellungsoptionen zu gewährleisten, während gleichzeitig die Integration mit Anwendungen für erweiterte Funktionalitäten unterstützt wird.

Beschreibung

• Support the availability and durability of critical services across production environments. • Monitor service health using SLIs, SLOs, and error budgets, and escalate issues when thresholds are at risk. • Participate in on-call rotations, incident response, and post-incident reviews to drive service improvements. • Follow established ITIL/OSS processes (incident, change, problem, and capacity management). • Develop automation for common operational tasks, reducing manual intervention and toil. • Contribute to monitoring, logging, and alerting frameworks (e.g., Prometheus, Grafana, Catchpoint,ELK). • Work with CI/CD pipelines, configuration management, and infrastructure as code tools (Terraform, Ansible, Jenkins). • Write scripts (Bash, Python, Go, etc.) to improve system reliability and efficiency. • Partner with engineering, product, and operations teams to support resilient system design and operations. • Assist in capacity planning and disaster recovery exercises. • Work with vendors and service providers to troubleshoot service issues and track SLA performance. • Document systems, share learnings, and help grow a reliability-minded engineering culture. • Contribute to playbooks, runbooks, and operational documentation. • Identify recurring issues and propose long-term improvements. • Promote reliability-focused practices within development and operations teams.

🎯 Anforderungen

• Bachelor’s degree in Computer Science, Engineering, or related field (or equivalent experience). • 2–4 years of experience in site reliability, systems engineering, or operations. • Exposure to large-scale, production-grade systems. • Solid Linux systems administration and troubleshooting skills. • Familiarity with service reliability concepts - monitoring, alerting, incident response, and root cause analysis. • Proficiency in at least one scripting language (Python, Bash, or Go). • Understanding of containers (Kubernetes, Docker) and microservices concepts. • Knowledge of incident response and operational best practices.

🏖️ Vorteile

• Flexible working hours • Professional development opportunities • Remote work options

Jetzt Bewerben

Ähnliche Jobs

🕒 vor 17 Tagen

OXIO

51 - 200

📡 Telekommunikation

☁️ SaaS

💳 Fintech

Site Reliability Engineer designing and implementing cloud platform for OXIO's Telecom services while maintaining production infrastructure.

🇺🇸 Vereinigte Staaten – Remote

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 18 Tagen

Cority

201 - 500

☁️ SaaS

📋 Compliance

Intermediate Site Reliability Engineer supporting reliability, performance, and scalability of cloud-hosted services. Collaborate with engineering teams and contribute to incident response processes.

🇺🇸 Vereinigte Staaten – Remote

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 18 Tagen

General Motors

10.000+ Mitarbeiter

🚗 Transport

⚡ Energie

🏢 Unternehmen

Design Release Engineer focusing on semiconductor product development and engineering processes at GM. Involves collaboration with teams to uphold strategic vision and core values of GM.

🇺🇸 Vereinigte Staaten – Remote

💵 $124.702 - $161.100 / Jahr

💰 €500.000.000 Grant im 2024-07

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🦅 H1B-Visum-Sponsor

info

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 18 Tagen

VetsEZ

201 - 500

🤝 B2B

☁️ SaaS

🏛️ Regierung

DevSecOps Engineer supporting secure software delivery and cloud infrastructure operations for federal government healthcare projects. Collaborating with teams to improve deployment reliability and efficiency.

🇺🇸 Vereinigte Staaten – Remote

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 18 Tagen

VetsEZ

201 - 500

🤝 B2B

☁️ SaaS

🏛️ Regierung

DevSecOps Engineer for federal healthcare technology initiative, collaborating on secure software delivery and automation. Focusing on CI/CD, cloud infrastructure, and deployment efficiency.

🇺🇸 Vereinigte Staaten – Remote

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich