Как быстро найти баг в API, если всё «падает только у пользователей»

Когда баг проявляется только у части пользователей, я всегда начинаю с сегментации. Смотрю, у кого именно ломается сценарий, и разбиваю по признакам: браузер, версия приложения, регион, тип аккаунта, время суток, наличие кеша. Очень часто причина оказывается в одном узком сегменте, а не в общей логике. После этого полезно сравнить реальные payload’ы успешного и неуспешного запроса, а не просто читать код. Разница бывает буквально в одном символе, пробеле или неожиданном null.

3 лайка