вторник, 23 октября 2018 г.

Site Reliability Engineering (SRE) - источники знаний по теме

Тема модная, имхо отпочковалась от DevOps, а скорее стало ее развитием (хотя считается, что развивались темы параллельно и одновременно).

Зародилась в Google, во многом построена на основе текущей структуры разработки Google, поэтому применение в других организациях сталкивается со сложностями.

По теме 3 основные книги (в порядке даты издания):
В первой книге про концепцию и базовые вещи. Вторая про внедрение на примерах. Третья похожа на вторую, но в виде примеров (в тч best practices) из разных компаний.

Обзоры первой книги:

Видео-рассказ одного из SRE-инженеров Google (на русском) "Как я научился не волноваться и полюбил пейджер"

Видео про одну из фундаментальных вещей SRE: "SLIs, SLOs, SLAs"

"Бесконечный список материалов по SRE" (цитата @asatarin) - это ссылкой можно было бы и обойтись, но Андрей прислал ее уже после публикации статьи :)

Комментариев нет:

Отправить комментарий