空前“蓝屏宕机”事件影响有多大?

婧婧聊商业 2024-07-22 07:28:36

CrowdStrike事件影响全球850万台Windows设备

腾讯科技讯 7月21日,针对近期Windows大范围“蓝屏死机”事件,微软官方博客发布《帮助客户度过CrowdStrike故障期》的声明。微软表示,尽管软件更新偶尔可能会引起干扰,但像CrowdStrike这样的重大事件并不经常发生。

微软目前估计CrowdStrike的更新影响了850万台Windows设备,占所有Windows设备不到1%。尽管百分比很小,但广泛的经济和社会影响反映了企业正在使用CrowdStrike支持许多关键服务。

空前“蓝屏宕机”事件影响有多大?专家:空运可能几周才恢复!

过去一天中,全球数字系统发生了史上最大规模的宕机故障,原因是美国信安公司CrowdStrike安全软件bug带崩了微软Windows系统。除了造成交易中断、航班取消等重大影响外,全球供应链也遭受了“暴击”。

据物流专家称,这场意外已经导致美国和全球港口中断,而高度复杂的航空系统受创最为严重,航空运输可能需要几周时间才能恢复正常。

供应链咨询公司Xeneta首席航空货运官Niall van de Wouw在一份声明中表示:“飞机和货物没有在他们应该在的地方,需要几天甚至几周的时间才能完全解决。这提醒我们,我们的海运和空运供应链面对IT 故障是多么不堪一击。”

据估算,在欧洲、亚洲和北美的全球最大航空货运枢纽,数千架航班停飞或延。

据悉,三大美国航司———联合航空、美国航空和达美航空已对所有航班发出地面停飞指令。美国廉价航空公司Frontier Airlines被迫暂停航班两个多小时,Sun Country Airlines表示第三方供应商影响了其预订和登记设施。

值得注意的是,全球供应链面临的新问题出现在全球需求上升之际,6月份的出货量同比增长了13%。据Xeneta称,航空货运供应有所增加,但同比仅增长3%,本就有限的运力已经导致托运人的成本上升。

中国企业未受蓝屏事件冲击

在“蓝屏事件”带来的全球冲击波中,中国企业受到的冲击较小,不少行业甚至波澜不惊。

据航空分析公司Cirium称,7月19日全球共有约110000个商业航班计划,截至英国标准时间11:00,已有1390个航班被取消。

一些机场的业务也受到影响。比如香港机场就在19日下午表示,由于微软系统出现大面积故障,香港国际机场的自助登机设施受到影响,航空公司须改用人工办理登机手续。

不过航班运作暂未受影响,机场已启动紧急应变机制,建议旅客在航班出发前三小时抵达机场,办理登机手续。

第一财经记者了解到,导致此次微软系统崩溃的是网络安全公司CrowdStrike技术更新导致,CrowdStrike本身是一款基于云端的防病毒软件,在国内没有销售。此次中国内地的航空公司和机场没有购买和部署CrowdStrike,当天的航班运行和进出港都基本正常。

酒店业方面,

资深酒店业分析人士、高级经济师赵焕焱表示,中国本土企业没有安装CrowdStrike,首旅如家、华住等本土酒店企业基本都没有受到影响,但是不少外资企业都有安装,受到影响的大多是国际酒店企业。今日,万豪国际集团、洲际酒店集团等均公开表示,相关业务已经恢复正常。

一家上海头部三甲医院信息科技术负责人对第一财经记者表示,CrowdStrike在国内基本是外企在使用,对医疗行业影响有限。

国产软件业自成体系

第一财经记者从多家国内航司了解到,国有航司使用的安全产品以国产为主,比如杀毒软件360(企业版称为天擎),目前还没碰到过类似的蓝屏事件,倒是使用微软的补丁升级有时会碰到蓝屏现象。

“像昨天这么严重的影响还是第一次听说,公司现在都要求控制补丁升级,并且也不会统一升级,”另一家国内航司的运控人士告诉记者,“此外,国有航司在运行过程需要使用的一些系统,大部分已实现国产替代了,而且我们公司的一些关键系统都是双系统同时跑的,比如飞行计划,国产自研和国外的系统并行使用。”

而对于机场值机端发生的问题,内地航司的值机和离港系统都由中航信提供,该公司是专业从事航空运输旅游信息服务的央企。

中航信一位人士告诉记者,目前公司在生产服务器端基本都是用的Linux系统,windows系列几乎没有,类似微软昨天的这一问题,在Linux上发生的概率比较低,“Linux上的服务都是自己启动的,你有没有启动,启动了什么,这个服务是什么作用,你都是知道的,出了问题定位也会很快,在复杂系统中,定位故障往往要花80%的时间,解决问题可能很简单。”

以下为微软博客全文:

帮助客户度过CrowdStrike故障期

7 月 18 日,独立网络安全公司 CrowdStrike 发布了软件更新,开始影响全球 IT 系统。虽然这不是微软事件,但考虑到它影响了我们的生态系统,我们想更新一下我们与 CrowdStrike 和其他公司合作采取的补救措施和支持客户的步骤。

自此次事件发生以来,我们一直与客户、CrowdStrike 和外部开发人员保持持续沟通,以收集信息并加快解决方案。我们认识到这个问题对企业和许多个人的日常生活造成了破坏。我们的重点是为客户提供技术指导和支持,以安全地将中断的系统恢复在线。采取的措施包括:

与 CrowdStrike 合作,使其开发解决方案的工作自动化。CrowdStrike已推荐一种解决方法来解决此问题,并已发布公开声明。Windows消息中心发布了有关解决 Windows 端点上的情况的说明。(https://learn.microsoft.com/en-us/windows/release-health/windows-message-center#3353)部署数百名微软工程师和专家直接与客户合作恢复服务。与其他云提供商和利益相关者(包括 Google Cloud Platform (GCP) 和 Amazon Web Services (AWS))合作,分享我们在整个行业中看到的影响状态的认识,并为与 CrowdStrike 和客户的持续对话提供信息。快速发布在此处找到的手动补救文档和脚本。(https://support.microsoft.com/en-us/topic/b1c700e0-7317-4e95-aeee-5d67dd35b92f)通过此处的Azure 状态仪表板让客户了解事件的最新状态。(https://azure.status.microsoft/en-gb/status)我们昼夜不停地工作,提供持续的更新和支持。此外,CrowdStrike 还帮助我们开发了可扩展的解决方案,该解决方案将帮助 Microsoft 的 Azure 基础设施加速修复 CrowdStrike 的错误更新。我们还与 AWS 和 GCP 合作,共同寻找最有效的方法。虽然软件更新偶尔会造成干扰,但像 CrowdStrike 事件这样的重大事件并不常见。我们目前估计,CrowdStrike 的更新影响了 850 万台 Windows 设备,占所有 Windows 机器的不到 1%。虽然这个比例很小,但广泛的经济和社会影响反映了运行许多关键服务的企业对 CrowdStrike 的使用。此次事件表明,我们广泛的生态系统(全球云提供商、软件平台、安全供应商和其他软件供应商以及客户)具有相互联系的特性。这也提醒我们,对于整个技术生态系统中的所有人来说,使用现有机制优先考虑安全部署和灾难恢复是多么重要。正如我们在过去两天所看到的,当我们合作和共同努力时,我们学习、恢复和前进的效率最高。我们感谢整个行业的合作与协作,我们将继续更新学习成果和后续步骤。
0 阅读:0