Почему в preprod всё было нормально, а в prod после релиза полезли 502
Кейс, который выглядит как баг приложения после релиза, а на деле оказывается стыком данных, нагрузки, таймаутов и слишком оптимистичного preprod.
$ grep -i "monitoring" posts/*
3 постов
Кейс, который выглядит как баг приложения после релиза, а на деле оказывается стыком данных, нагрузки, таймаутов и слишком оптимистичного preprod.
О скучных, но повторяющихся сбоях, которые не выглядят страшными на старте, зато стабильно отнимают время в эксплуатации.
До первого реального сбоя мониторинг кажется необязательным украшением. После него начинаешь видеть его совсем иначе.