Microsoft 365 全球故障16个小时,只因数据中心停电

2022/6/23 9:45:33 来源:云头条 作者:Ye编辑 分类:行业动态

微软透露,本周的Microsoft 365全球故障是由基础设施停电引起的,停电导致在多个地区为用户提供服务的流量管理管理进行故障切换。



从6月20日星期一晚上11点00分开始,客户在尝试访问和使用Microsoft 365服务时开始遇到并报告几个问题。据微软声称,这次事件中遇到的问题包括访问某些Microsoft 365服务时出现延迟和失败。


客户报告问题时还透露了这些方面的信息:持续的重新登录请求、电子邮件在排队后未投递,以及尽管尝试了所有可以使用的连接方法,仍无法访问Exchange Online邮箱。受影响的服务包括:Microsoft Teams通讯平台、Exchange Online托管电子邮件平台、SharePoint Online、Universal Print和Graph API。


微软在调查故障的根本原因后作出了回应,也揭示了与该公司未向客户透露新的事件信息有关的一些问题。


尽管微软告诉客户他们可以在EX394347和MO394389下从管理中心找到有关此事件的更多信息,但用户报告表明这些事件故障单并没有出现,因此客户实际上蒙在鼓里。


停电导致长达16个小时的事故 


在6月21日星期二下午3点27分,此时距离发现停电的最初迹象已过去逾16个小时,微软在发给客户的MO394389服务警报的最新消息中表示,根本原因是基础设施停电。


“基础设施停电后,为主要在西欧的用户提供服务的Microsoft 365流量管理系统势必需要进行故障切换。”该公司解释道,“该操作未能正确完成,导致多项Microsoft 365服务出现功能延迟和访问失败。”


对于西欧的客户来说,故障最为严重。不过,故障影响蔓延到了整个欧洲中东非洲(EMEA)、北美和亚太地区的“一小部分”用户。


微软还驳斥了声称影响该公司Outlook网页版服务的另一起故障也与此事件有关的说法。“我们已从我们更新后的服务监控确认,所有服务在目标系统重启后都保持正常运行。”微软补充说,“此外,我们完成了对Outlook网页版可能受到的剩余影响的调查,确认这是一个与这次事件无关的已知问题。”


Cloudflare在星期二也遭受了大规模中断,这次事件影响了十几个数据中心和成百上千的主要在线平台和服务。


Cloudflare后来透露,该事件是在实施变更时遇到的配置错误引起的,实施变更的本意是为了提高网络弹性。

相关资讯