Почему в preprod всё было нормально, а в prod после релиза полезли 502
Кейс, который выглядит как баг приложения после релиза, а на деле оказывается стыком данных, нагрузки, таймаутов и слишком оптимистичного preprod.
$ grep -i "incident" posts/*
2 постов
Кейс, который выглядит как баг приложения после релиза, а на деле оказывается стыком данных, нагрузки, таймаутов и слишком оптимистичного preprod.
До первого реального сбоя мониторинг кажется необязательным украшением. После него начинаешь видеть его совсем иначе.