Cloudflare пояснила причину масштабного збою, що вплинув на роботу значної частини інтернету

Життя 2025-11-21 12:30

Компанія Cloudflare пояснила причину масштабного збою, що стався 18 листопада та вплинув на роботу значної частини інтернету, включно з ChatGPT, X та Downdetector, назвавши це інцидентом "найгіршим від 2019 року".

Зазначається, що проблема виникла через некоректне налаштування запиту у базі даних ClickHouse, яка генерує конфігураційний файл для моделі машинного навчання системи Bot Management.

Зміна в поведінці запиту спричинила появу великої кількості дублікатів даних. Це призвело до швидкого зростання конфігураційного файлу, який перевищив встановлені ліміти пам'яті.Як наслідок, це вивело з ладу основну проксі-систему, яка обробляє трафік клієнтів, що залежить від модуля ботів. Клієнти, які використовували згенерований показник ботів у своїх правилах, почали блокувати реальний трафік, тоді як компанії, які не використовували цю функцію, залишалися онлайн.

Як уточнили у Cloudflare, проблема не була пов'язана з DNS, атакою чи новими системами на базі генеративного ШІ - помилка виникла саме у внутрішній логіці оновлення конфігурації Bot Management.

Для запобігання подібним інцидентам, компанія оголосила такі кроки:

  • посилення обробки конфігураційних файлів так само як і користувацького введення;
  • розширення кількості глобальних "kill switch" для функцій;
  • запобігання ситуаціям, коли core dump або звіти про помилки можуть перевантажувати систему;
  • перегляд усіх режимів відмови у ключових проксі-модулях.

За оцінками Cloudflare, приблизно 20% інтернету проходить через її мережу, тому будь-яка помилка у центральних модулях здатна спричинити глобальний вплив.