Ingénieur Site Reliability (SRE)

Emploi pas sur LinkedIn

🔥 il y a 10 minutes

🌏 N'importe où dans le monde

⏰ Temps Plein

🟠 Senior

🔴 Expert

⛑ Ingénieur DevOps & SRE

🗣️🇺🇸🇬🇧 Anglais requis

Postuler Maintenant
Trouver des Emplois à Distance Similaires

📊 Vérifiez votre score de CV pour ce poste

Améliorez vos chances d'obtenir un entretien en vérifiant votre score de CV avant de postuler.

Logo of Supabase

Supabase

51 - 200 employés

Fondée en 2020

☁️ SaaS

🔌 API

🤖 Intelligence artificielle

💰 €80 000 000 Series B en 2022-05

SaaS • API • Artificial Intelligence

Supabase est une alternative open source à Firebase, proposant aux développeurs une plateforme complète de Backend-as-a-Service. Elle fournit un ensemble d’outils, notamment une base de données Postgres, une authentification utilisateur avec Row Level Security, des API RESTful instantanées, des Edge Functions pour le déploiement de code personnalisé et une synchronisation des données en temps réel. Supabase prend également en charge le stockage de fichiers volumineux et l’intégration avec des modèles de machine learning pour des vector embeddings. Avec sa plateforme, les développeurs peuvent créer des applications évolutives en toute simplicité et exploiter les capacités robustes de Postgres sans gérer l’infrastructure backend. Conçue pour rationaliser les workflows de développement, Supabase est plébiscitée par des entreprises du monde entier pour sa fiabilité et ses performances, et permet de faire passer des projets d’un petit nombre d’utilisateurs à de très larges bases.

Description

• Collaborer avec les équipes de service pour définir des SLI et des SLO pertinents, fondés sur l'expérience client, et établir des politiques d'error budget qui les transforment en décisions d'ingénierie • Être responsable et faire évoluer le processus d'Operational Readiness Review (ORR) — mener des revues pour les nouveaux services et les changements majeurs en matière d'observabilité, de gestion des alertes, de runbooks, de capacité et de dégradation maîtrisée • Renforcer le pipeline incident → amélioration : relier les conclusions des postmortems aux lacunes de préparation opérationnelle, identifier les schémas de défaillance récurrents et piloter des corrections systémiques • Jouer le rôle d'expert en fiabilité que les équipes sollicitent pour les revues d'architecture, l'analyse des modes de défaillance, la cartographie des dépendances et la conception de la résilience • Identifier et quantifier les tâches opérationnelles répétitives (toil) au sein de l'organisation, et développer ou promouvoir des automatisations pour les éliminer • Aider les équipes à concevoir des pratiques d'astreinte durables : qualité des alertes, parcours d'escalade, couverture des runbooks et réduction du bruit • Suivre et rendre compte de la maturité opérationnelle de l'organisation, mettre en évidence les lacunes systémiques et piloter les actions correctives

🎯 Exigences

• Justifier d'au moins 7 ans d'expérience en SRE, production engineering ou postes axés sur la fiabilité, y compris une expérience de définition des pratiques SRE et de leur adoption par les équipes d'ingénierie • Avoir une mentalité d'ingénieur logiciel — vous écrivez du code et développez des outils, pas seulement les configurer • Expérience pratique de la définition et de l'opérationnalisation d'SLO/SLI à grande échelle, y compris des politiques d'error budget ayant réellement influencé des décisions d'ingénierie • Solide expérience en réponse aux incidents, animation de postmortems et transformation des enseignements d'incidents en améliorations systémiques • Avoir travaillé avec des systèmes multi-tenant à grande échelle (atout : plateformes de bases de données managées ou Postgres) • Maîtrise de l'infrastructure cloud (préférence AWS) et de l'infrastructure-as-code (Pulumi préféré, Terraform/CDK également acceptables) • Communiquer clairement et de manière persuasive — ce poste nécessite d'influencer sans autorité au sein d'une organisation distribuée • Expérience des équipes asynchrones ou distribuées à l'échelle mondiale • Être motivé par le fait de rendre les autres équipes plus efficaces plutôt que d'être celui qui répare tout

🏖️ Avantages

• Télétravail intégral • Participation au capital (ESOP) • Allocation tech • Couverture santé • Off-sites annuels • Horaires flexibles • Développement professionnel

Postuler Maintenant

Emplois Similaires

🕒 il y a 22 jours

Chess.com

501 - 1000

🎮 Jeux vidéo

📚 Éducation

📱 Médias

Ingénieur Site Reliability chez Chess.com garantissant la stabilité de l'infrastructure et des systèmes évolutifs pour des millions d'utilisateurs. Jouant un rôle critique pour soutenir le développement rapide et le déploiement de nouvelles fonctionnalités.

🌏 N'importe où dans le monde

💰 Private Equity Round en 2022-01

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

⛑ Ingénieur DevOps & SRE

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 1 mois

Shuru

51 - 200

🤖 Intelligence artificielle

🤝 B2B

🏢 Entreprise

Ingénieur DevOps senior aidant à faire évoluer la plateforme cloud de la pré-production à la production pour une fintech. Collaboration avec les équipes pour améliorer l'infrastructure, les pipelines de déploiement et les processus de supervision.

🌏 N'importe où dans le monde

⏰ Temps Plein

🟡 Intermédiaire

🟠 Senior

⛑ Ingénieur DevOps & SRE

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 1 mois

Social Discovery Group

1001 - 5000

🌍 Impact social

📱 Médias

Ingénieur DevOps Senior développant et faisant évoluer l’IaC et les systèmes CI/CD pour des produits de découverte sociale. Collaboration avec des équipes internationales et pilotage de l’automatisation en mettant l’accent sur la sécurité et l’observabilité.

🌏 N'importe où dans le monde

⏰ Temps Plein

🟠 Senior

⛑ Ingénieur DevOps & SRE

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Canonical

501 - 1000

Ingénieur Senior Fiabilité de Site avec infra-as-code en Python pour les opérations Cloud chez Canonical. Permettre le DevSecOps pour des applications sur OpenStack et Kubernetes dans un environnement global et distant.

🌏 N'importe où dans le monde

⏰ Temps Plein

🟠 Senior

⛑ Ingénieur DevOps & SRE

🗣️🇺🇸🇬🇧 Anglais requis

🕒 il y a 2 mois

Canonical

501 - 1000

Ingénieur Senior Site Reliability / GitOps développant des solutions d'automatisation pour les services informatiques de Canonical. Collaboration à l'échelle mondiale pour améliorer l'efficacité opérationnelle et la gestion de l'infrastructure.

🌏 N'importe où dans le monde

⏰ Temps Plein

🟠 Senior

⛑ Ingénieur DevOps & SRE

🗣️🇺🇸🇬🇧 Anglais requis