Cloudflare声称,2022年6月21日一起大规模中断影响了其十多个数据中心和数百个主要在线平台及服务,这起中断是由本应增强网络弹性的变更导致的。
Cloudflare在调查此事件后表示,2022年6月21日,Cloudflare遭遇了中断,结果影响了Cloudflare 19个数据中心的数据流量。
据悉,这19个数据中心站点处理Cloudflare全球流量的很大一部分。这次中断是作为一个长时间运行的项目一部分的变更引起的,原本旨在为Cloudflare最繁忙的那些站点增强弹性。
据用户报告,受影响网站和服务的完整列表包括但不限于:Amazon、Twitch、AWS、Steam、Coinbase、Telegram、Discord、DoorDash和Gitlab等。
中断影响了Cloudflare最繁忙的站点
在全球各地的客户和用户开始陆续报告Cloudflare网络连接中断后,这家公司在协调世界时(UTC)上午 6点34分开始调查此事件。
Cloudflare声称:“如果客户试图访问受影响地区的Cloudflare站点,就会遇到500出错信息。该事件影响了我们网络中的所有数据平面服务。”
虽然Cloudflare的系统状态网站上发布的事件报告没有详细披露导致中断的原因,但该公司在官方博客上分享了有关6月21日这起中断的更多信息。
Cloudflare团队补充道:“这次中断是作为一个长时间运行的项目一部分的变更引起的,原本旨在为我们最繁忙的站点增强弹性。”
“这些站点处的网络配置变更导致了从06点27分开始的中断。在06点58分,第一个数据中心恢复正常运行,到07点42分有数据中心恢复正常工作。用户可能无法访问依赖Cloudflare的网站和服务,具体看用户所在的位置。在其他地方,Cloudflare继续正常运行。”
虽然受影响的位置仅占Cloudflare整个网络的4%,但它们的中断却影响了Cloudflare在全球处理的所有HTTP请求中的大约50%。
导致中断的变更是一个更庞大项目的一部分,该项目将把Cloudlfare最繁忙站点的数据中心转变成更具弹性和灵活性的架构,该架构内部名为多托管入网点(Multi-Colo PoP,即MCP)。

这起事件中受影响的数据中心站点包括:阿姆斯特丹、亚特兰大、阿什本、芝加哥、法兰克福、伦敦、洛杉矶、马德里、曼彻斯特、迈阿密、米兰、孟买、纽瓦克、大阪、圣保罗、圣何塞、新加坡、悉尼和东京。