Компанія Cloudflare пояснила причину масштабного збою, що стався 18 листопада та вплинув на роботу значної частини інтернету, включно з ChatGPT, X та Downdetector, назвавши це інцидентом "найгіршим від 2019 року".
Зазначається, що проблема виникла через некоректне налаштування запиту у базі даних ClickHouse, яка генерує конфігураційний файл для моделі машинного навчання системи Bot Management.
Зміна в поведінці запиту спричинила появу великої кількості дублікатів даних. Це призвело до швидкого зростання конфігураційного файлу, який перевищив встановлені ліміти пам'яті.Як наслідок, це вивело з ладу основну проксі-систему, яка обробляє трафік клієнтів, що залежить від модуля ботів. Клієнти, які використовували згенерований показник ботів у своїх правилах, почали блокувати реальний трафік, тоді як компанії, які не використовували цю функцію, залишалися онлайн.
Як уточнили у Cloudflare, проблема не була пов'язана з DNS, атакою чи новими системами на базі генеративного ШІ - помилка виникла саме у внутрішній логіці оновлення конфігурації Bot Management.
Для запобігання подібним інцидентам, компанія оголосила такі кроки:
За оцінками Cloudflare, приблизно 20% інтернету проходить через її мережу, тому будь-яка помилка у центральних модулях здатна спричинити глобальний вплив.