Ryan He
>系統規模過於龐大、模組間耦合複雜、設定檔更新頻繁且無法分批驗證,只要其中一環產生偏差,便可能引發全球性的連鎖故障。這次事件成為再次提醒產業需要更嚴格的設定檔驗證、隔離與回退設計的重要案例。

Cloudflare 2025 年 11 月 18 日故障事故後報告
Cloudflare outage on November 18, 2025

Cloudflare 在 2025 年 11 月 18 日的全球故障,起因於一項資料庫存取權限調整,意外讓 ClickHouse 查詢回傳重複欄位,導致用於 Bot Management 的特徵設定檔(feature file)尺寸突然倍增。這份設定檔會每隔幾分鐘重新產生並快...

Ryan He (@ryanhe)
載入新的回覆