Максим Ремнев
Компания: Cloud.ru
Насколько сложно внедрить тестирование отказоустойчивости в продуктовой команде? В докладе расскажем о существующих подходах и инструментах, а также на простых примерах покажем, как применение практик chaos engineering может повысить стабильность ваших сервисов.
Подробно рассмотрим процесс тестирования, принятый в нашей команде, и разберем основные проблемы, с которыми столкнулись при организации и проведении тестов. Покажем, как tree-fault analysis помогает при формировании гипотез, и обсудим популярные проблемы, связанные с надежностью и доступностью распределенных систем.
Наш опыт будет полезен командам, которые только планируют внедрять тестирование отказоустойчивости, а также тем, кто уже сталкивается с необходимостью расширения нефункциональных проверок своих сервисов.
Компания: Cloud.ru
Компания: Cloud.ru
Компания: Cloud.ru