2021-03-30
00:00 - как реагировать на инциденты, постмортемы, резервирование
18:20 - аналогия с пробоем конденсатора
21:00 - что такое постмортем
22:55 - логистическая кривая
24:53 - предсказание пробоя
25:24 - принцип разбора ошибок
27:20 - нужна постоянная тренировка поиска корневых причин на ошибках, редкий постмортем малополезен
32:09 - много постмортемов => более надежная система
37:21 - подытог
39:05 - спираль качества
40:20 - нужен ли поиск виновных
49:20 - проблема экспоненциальных процессов
51:08 - нет единой корневой причины
53:00 - время жизни без техобслуживания и минусы автоматизации
58:21 - социотехническая система должна делаться с запасом возможностей - не слишком надежна, а достаточно надежна
01:00:36 - стабильность vs ригидность и jira sunk cost fallacy
01:02:40 - итерации в найме
01:07:20 - еще раз про поиск виновных
01:09:00 - нельзя просто так взять и стать blameless
01:13:28 - и еще раз про поиск виновных