SRE

翻译
blog-thumb
by Eric Li/ on 22 Mar 2020

使用 SRE 原理识别和跟踪琐事

Google 站点可靠性工程师(SRE)用来验证有效性的关键指标之一就是衡量我们如何利用每一天的时间。我们希望有足够的时间来进行长期性项目的工作,但鉴于我们也负责 Google 服务的持续运营,有时候也需要做一些手工工作。我们的目标是将少于一半的时间花在所谓的“琐事”上。那什么是琐事,怎样才能阻止它干扰工程师的工作速度?我们将在这篇文章中讨论这些问题。

翻译
blog-thumb
by 周一行/ on 22 Mar 2020

SRE 团队的组织方式以及入门方法

在 Google,站点可靠性工程(SRE)是我们不断定义可靠性目标,衡量这些目标,并根据需要努力改善我们的服务的做法。我们最近指导您浏览了 SRE 工作手册。您可以将这些指导视为 SRE 团队通常会做的事情,并结合团队的成熟度,确定何时团队倾向于执行这些任务。我们相信,许多公司都可以按照该指导来启动和发展新的 SRE 团队。