Senior Site Reliability Engineer, Core AI Infrastructure

🕒 vor 4 Tagen

🏄 California – Remote

info

💵 $186.065 - $218.900 / Jahr

⏰ Vollzeit

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🦅 H1B-Visum-Sponsor

info

🗣️🇺🇸🇬🇧 Englisch erforderlich

Jetzt Bewerben
Ähnliche Remote-Jobs finden

📊 Überprüfen Sie Ihre Lebenslauf-Bewertung für diese Stelle

Verbessern Sie Ihre Chancen auf ein Vorstellungsgespräch, indem Sie Ihre Lebenslauf-Bewertung vor der Bewerbung überprüfen.

Logo of Coinbase

Coinbase

1001 - 5000 Mitarbeiter

Gegründet 2012

₿ Crypto

💸 Finanzen

💳 Fintech

💰 €21.400.000 Post-IPO Equity im 2022-11

Crypto • Finance • Fintech

Coinbase ist eine führende Kryptowährungsbörse, die es Einzelpersonen und Institutionen ermöglicht, verschiedene Krypto-Assets wie Bitcoin und Ethereum zu kaufen, zu verkaufen und zu handeln. Das Unternehmen bietet fortschrittliche Handelswerkzeuge, institutionelle Lösungen und eine selbstgehostete Wallet für die Speicherung und Verwaltung von Kryptowährungen. Mit einem starken Fokus auf Sicherheit und Transparenz bietet Coinbase eine vertrauenswürdige Plattform, die weltweit von Millionen genutzt wird. Es unterstützt verschiedene Funktionen, einschließlich Staking, Belohnungen verdienen und Krypto über ihre Karten ausgeben. Darüber hinaus bietet Coinbase Entwicklertools und APIs zum Erstellen von On-Chain-Anwendungen, was es zu einem umfassenden Zentrum für die Teilnahme an der Krypto-Wirtschaft macht.

Beschreibung

• Own the reliability, monitoring, and incident response lifecycle for AI infrastructure services, including on-call support for AWS deployment pipelines, root cause analysis, and blameless retros. • Build automation and tooling to streamline operational IT workflows, eliminate manual tasks, and improve deployment velocity across CI/CD frameworks and Kubernetes environments. • Partner with the Coinbase Infrastructure team to extend CI/CD frameworks supporting IT services and enterprise network platforms, and with Security and Compliance to integrate surveillance tooling into deployment pipelines. • Strengthen observability and documentation standards across IT engineering by defining metrics, implementing monitoring solutions, and maintaining technical documentation that sets a standard of excellence. • Develop full-stack applications that power internal AI products and infrastructure with Go or Python.

🎯 Anforderungen

• 5+ years of experience automating and supporting cloud infrastructure (AWS) and network environments • Proven experience deploying, managing, and troubleshooting containerized workloads using Docker and Kubernetes in production environments • Proficiency in at least one scripting or programming language (Python, Bash, Ruby, or Go) and version control workflows using Git-based CI/CD pipelines • Track record of leading incident response in environments with strict SLAs, including root cause analysis, blameless retros, and measurable reliability improvements • Utilizes generative AI responsibly, maintaining human oversight to deliver business-ready outputs and drive measurable improvements in workflow efficiency, cost, and quality.

🏖️ Vorteile

• medical • dental • vision • 401(k)

Jetzt Bewerben

Ähnliche Jobs

🕒 vor 4 Tagen

Aya Healthcare

5001 - 10000

⚕️ Krankenversicherung

🎯 Rekrutierung

Lead the SRE team at Aya Healthcare for enhancing product reliability and operational efficiency. Manage incident responses and AI-native operations for a top healthcare workforce solutions provider.

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 4 Tagen

Offchain Labs

11 - 50

₿ Crypto

🌐 Web 3

Site Reliability Engineer at Offchain leading a movement in blockchain scalability and security. Tackling real-world challenges and transforming interactions with decentralized applications.

🇺🇸 Vereinigte Staaten – Remote

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 4 Tagen

BeyondTrust

1001 - 5000

🔒 Cybersecurity

Cloud Operations Engineer monitoring, maintaining, and responding to incidents for BeyondTrust Cloud Service. Collaborating across teams to ensure service health and handling cloud environments.

🇺🇸 Vereinigte Staaten – Remote

💰 Private Equity Round im 2021-05

⏰ Vollzeit

🟡 Mittelstufe

🟠 Senior

⛑ DevOps- und Site Reliability Engineer (SRE)

🦅 H1B-Visum-Sponsor

info

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 4 Tagen

MKS2 Technologies

201 - 500

🤝 B2B

🔒 Cybersecurity

Site Reliability Systems Engineer working with monitoring tools to enhance VA's infrastructure reliability. Collaborating across teams to resolve outages and improve service quality for veterans.

🇺🇸 Vereinigte Staaten – Remote

⏰ Vollzeit

🟠 Senior

🔴 Experte

⛑ DevOps- und Site Reliability Engineer (SRE)

🗣️🇺🇸🇬🇧 Englisch erforderlich

🕒 vor 4 Tagen

Mozilla

501 - 1000

👥 B2C

🔒 Cybersecurity

Senior Site Reliability Engineer establishing infrastructure and operational systems for Thunderbird's open-source email applications. Focusing on reliability improvements and collaboration with distributed teams.

🗣️🇺🇸🇬🇧 Englisch erforderlich