您现在的位置是:物联网 >>正文
Cloudflare API 服务中断事件分析:React useEffect 漏洞引发级联故障
物联网2636人已围观
简介Cloudflare 近日发布详细事故报告,披露2025年9月12日导致其控制面板和API服务中断超过一小时的重大故障。经调查,此次事件源于控制面板软件漏洞与服务更新的叠加效应,最终引发关键内部系统的 ...
Cloudflare 近日发布详细事故报告,服发级披露2025年9月12日导致其控制面板和API服务中断超过一小时的断事洞引重大故障 。经调查 ,漏联故此次事件源于控制面板软件漏洞与服务更新的服发级叠加效应 ,最终引发关键内部系统的断事洞引级联故障 。

事件始于Cloudflare控制面板新版本的云计算漏联故发布。公司报告显示,服发级该更新中的断事洞引React代码存在缺陷,导致对内部租户服务API(Tenant Service API)发起重复且过度的漏联故调用。该服务是服发级处理API请求授权的源码库核心组件。
具体而言 ,断事洞引漏洞存在于useEffect钩子中——错误配置使其在每次状态变更时都会触发API调用 ,漏联故导致单次面板渲染期间形成请求循环 。服发级恰逢此时租户服务API自身也正在进行更新部署。断事洞引
存在缺陷的漏联故控制面板产生"惊群效应"(thundering herd),使新部署的高防服务器服务不堪重负,最终引发异常故障与恢复失败。由于租户服务承担API请求授权职能,其瘫痪导致UTC时间17:57起Cloudflare控制面板及大量API服务大面积中断。
应急处置过程Cloudflare工程团队首先监测到租户服务负载激增 ,随即采取减压扩容措施:
实施临时全局速率限制规则增加Kubernetes pods资源以提升吞吐量这些措施虽部分恢复了API可用性,但控制面板仍处于宕机状态 。UTC时间18:58尝试修补服务错误代码路径的服务器租用操作适得其反,导致API可用性二次短暂受影响。该变更被迅速回滚 ,最终于19:12全面恢复服务 。
值得注意的是 ,此次中断仅限于处理配置管理的亿华云控制平面(control plane) 。得益于严格隔离机制 ,处理客户流量的数据平面(data plane)未受影响,终端用户服务始终保持在线 。
后续改进措施Cloudflare已制定多项防范措施 :
优先将租户服务迁移至Argo Rollouts部署工具 ,该工具可自动检测错误并回滚版本在控制面板API重试逻辑中引入随机延迟机制 ,缓解"惊群效应"大幅增加租户服务资源配置改进容量监控系统,源码下载实现主动预警功能Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“商站动力”。http://www.noorid.com/news/455c499540.html
上一篇:漏洞都管理不好还谈什么安全
下一篇:简析机密蔓延的危害与防护建议
相关文章
改名的风险!GitHub上数百万个存储库可能被劫持
物联网一项新的研究显示,许多企业在重命名项目时,不知不觉地将其代码库的用户暴露在重载劫持之下。GitHub上数以百万计的企业软件存储库容易受到劫持,这是一种相对简单的软件供应链攻击,攻击者会将某个特定存储库 ...
【物联网】
阅读更多vivo X5Max隔空解锁开启方法
物联网vivo X5Max隔空解锁开启方法。传说中;隔空取物”是武林中的绝学,如今vivo X5Max隔空解锁不但继承了前者神奇的特点,更重要的是简单易学。注意了,下面手机世界小编就要将这隔空解锁的功能传授 ...
【物联网】
阅读更多为什么数据中心是游戏行业的未来?
物联网我们生活在2023年,这一年人们对数字化、自动化的生活方式和繁荣的游戏领域有着巨大的兴趣。然而,随着游戏空间的不断扩大,构建足够的计算基础设施的问题也随之而来。由存储、网络和计算基础设施组成的数据中心 ...
【物联网】
阅读更多