503 Подкаст

Траблшутинг


Listen Later

Если вам кажется, что ваше приложение никогда не работает нормально, то вы не одиноки. Вместе с лидом SRE команды из Тинькофф Мариной Калетуриной разберемся, что такое штатная работа приложения, и как понять, что приложение ведет себя неправильно.


Разберемся, как действовать инженеру, работающему с продом, в случае ЧП, как на основе гипотез и диагностики найти место сбоя и сузить круг подозреваемых, и как исправить ситуацию — расставить приоритеты и управлять командой для решения проблем.


Ведущий подкаста — Андрей Дмитриев, сооснователь JUG Ru Group.

Идейный вдохновитель и партнер подкаста - команда Тинькофф.


Полезные ссылки:

Книга Брендана Грегга Systems Performance https://www.amazon.com/Systems-Performance-Brendan-Gregg/dp/0136820158/ref=as_li_ss_tl?ie=UTF8&linkCode=sl1&tag=deirdrestraug-20&linkId=815ef3388ba65b674f4f8fd582713f24&language=en_US 

Книга Мартина Клеппмана Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems https://www.amazon.com/Designing-Data-Intensive-Applications-Reliable-Maintainable/dp/1449373321

...more
View all episodesView all episodes
Download on the App Store

503 ПодкастBy mave