Навпростець

Сайт впав. Які причини і хто відповідальний? | Навпростець #12


Listen Later

Подкаст про цифровий світ та IT. Ведучий Юра Кононенко запрошує професіоналів з різних сфер і розбирає цікаві теми.
У цьому випуску разом з Борисом Дрожаком — SRE Architect в компанії DataRobot поговорили про стабільність додатків, як це впливає на користувачів та як це впливає на бізнес. Також обговорили підходи до виміру стабільності, і коли це важливо, а коли на це можна просто забити.
У випуску було багато курйозних прикладів з життя, коли в застосунку чи інфраструктурі щось йшло не так і як з цим боролися.
Також в Бориса є свій блог, який ви можете знайти за посиланнями: Instagram — https://www.instagram.com/the_borys_official
TikTok — https://www.tiktok.com/@the_borys_official
Якщо ще не підписані на мене в Instagram, це можна зробити тут —
https://www.instagram.com/yura_kononenko
Корисні ресурси із випуску:
Книга — The Phoenix Project: A Novel about IT, DevOps, and Helping Your Business Win
Стаття — STELLA reports https://snafucatchers.github.io/
00:00 Інтро
00:34 Чим Займається Борис
03:23 502 bad gateway на сайті
06:15 Як прибиральниця вимикала сервер
08:56 Як падав Amazon
10:41 Як Борис у Cisco із блискавками боровся
13:00 Як поганий код впливає на стабільність додатку
16:53 Фактор чорного лебедя в ІТ компанії
21:36 Відомі даунтайми, churn
24:34 Як вимірюють, що додаток працює добре
34:30 Хто вирішує що застосунку важлива стабільність
39:58 Хто такий SRE
43:27 Чи може простий інженер бути SRE?
48:00 Що таке error budget
53:52 SLA, SLO, SLI
55:54 Чат жепете і SRE
58:20 Рекомендації від Бориса
...more
View all episodesView all episodes
Download on the App Store

НавпростецьBy Навпростець