来源:新智元
![](http://k.sinaimg.cn/n/sinakd20240720s/200/w700h300/20240720/bd40-db64448750b224dc4da16046d92ff047.png/w700d1q75cms.jpg)
新智元报道
编辑:Aeneas 好困
【新智元导读】周五下午,一次安全软件的更新,竟然引发了全球停摆。航班停飞,银行宕机,全球打工人摸鱼狂欢,我们亲眼见证了这场「史上最大规模IT故障」。
活久见!
只因一次更新,Windows集体蓝屏,全世界直接「断片」了——
![](http://k.sinaimg.cn/n/sinakd20240720s/640/w960h1280/20240720/64e7-1e3010a16554721479861e4119764947.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/365/w873h292/20240720/3bc4-4e14a1478fc6bc1318fb3b46b522056b.png/w700d1q75cms.jpg)
大批金融机构、电视广播公司、医疗机构、支付系统原地瘫痪,甚至连便利店和售货机都「停摆」了。
![](http://k.sinaimg.cn/n/sinakd20240720s/356/w740h416/20240720/c15c-df11502c8c3b51a1005ae2d1ba6a1597.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/500/w900h1200/20240720/e6d7-67c2b16ed7796ee1e5c76fe4979d0517.png/w700d1q75cms.jpg)
在英国的医院,医生无法访问患者记录和预约系统,只能在纸上记录患者病情、手写处方。
Sky News和BBC也暂时停播。
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/2723-2faa3983ed41be27ce27d797fe20e66c.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/851a-92773ae25fe8218b82742e6f0cac8286.png/w700d1q75cms.jpg)
同时,欧洲、澳大利亚和印度的银行客户也发现:自己的在线账户登不上了。
![](http://k.sinaimg.cn/n/sinakd20240720s/775/w675h900/20240720/d9d8-e048d189d1151b8db2edc2d5884f0909.png/w700d1q75cms.jpg)
而要说受到打击最严重的,当属航空公司了。
![](http://k.sinaimg.cn/n/sinakd20240720s/75/w315h560/20240720/3935-gifd393936c96d89b15c1a2263f8ad3b420.gif/w700d1q75cms.jpg)
数据显示,全球有超过4000架航班被取消。
![](http://k.sinaimg.cn/n/sinakd20240720s/296/w576h520/20240720/f52e-gifedc013d5a287eee2dcc9ffaa625365fd.gif/w700d1q75cms.jpg)
在美国,United、Delta和American等航空公司被迫停飞和延误,大批乘客滞留在机场。
![](http://k.sinaimg.cn/n/sinakd20240720s/356/w740h416/20240720/b666-e771ab442058cdb9035a444d29ba6d2b.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/33d0-4dfb0dc55d3d17051af31598177b08b1.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/450/w800h450/20240720/bba7-6aa97a021a54724ae494fed5b9857bfd.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/775/w900h675/20240720/e3e1-eca7bb3332c60458381eed276715b60f.png/w700d1q75cms.jpg)
全球一片混乱之际,「始作俑者」被揪了出来——它就是网络安全巨头CrowdStrike。
![](http://k.sinaimg.cn/n/sinakd20240720s/505/w873h432/20240720/16f4-319a5bfe8312062f6a3e1953409d2653.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/642/w935h1307/20240720/f8cf-fd8fbcc28f7d0a497f12f0c50bb4cf83.png/w700d1q75cms.jpg)
实际上,国外存在着大量运行CrowdStrike软件的计算机系统——
这些设备包括杂货店的收银机、机场和火车站的出发信息板、学校的计算机、工作用的笔记本电脑和台式电脑、机场的值机系统、航空公司的票务和调度平台、医疗网络等等。
因此,CrowdStrike的故障会在全球范围内以各种方式造成混乱。
![](http://k.sinaimg.cn/n/sinakd20240720s/369/w875h294/20240720/1995-fb101731580f65d868807cb8bb957c0b.png/w700d1q75cms.jpg)
闯出如此大祸之后,「罪魁祸首」CrowdStrike的股票在收盘时已暴跌11%,市值蒸发了近100亿美元。
![](http://k.sinaimg.cn/n/sinakd20240720s/793/w1014h579/20240720/e9a6-6c2c564b3cc89f9f4c05a29bde9b1014.png/w700d1q75cms.jpg)
对它来说,这是2022年以来最糟糕的一天。
![](http://k.sinaimg.cn/n/sinakd20240720s/512/w1080h232/20240720/1d27-47132ff70507da9b12ea0090887bdde6.png/w700d1q75cms.jpg)
对此,AI大牛Karpathy一针见血地提出了个中关键:我们该如何进行设计才能防范这种风险?
![](http://k.sinaimg.cn/n/sinakd20240720s/521/w881h440/20240720/dede-eff8dc2d7ed325534321f5dcd4ddc820.png/w700d1q75cms.jpg)
全球大崩溃
在机场,人们焦急地等待着系统恢复。
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/d361-aa5c7dde70c9f55d98e9261ce3160dda.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/356/w740h416/20240720/1544-e51a47f0dba6a5c4f45b0e3bf9d23f10.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/200/w1080h720/20240720/c20d-f392db4d41013b9f408ce49a79116ab9.png/w700d1q75cms.jpg)
超市也只能用现金付款了。
![](http://k.sinaimg.cn/n/sinakd20240720s/775/w900h675/20240720/4f30-d9f01cd3d51d6dce5a98eaf17f34a040.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/449/w800h449/20240720/ee11-85b81f816c4eb548d87e1c81165048a4.png/w700d1q75cms.jpg)
时代广场的广告牌,变成了一片空白。
![](http://k.sinaimg.cn/n/sinakd20240720s/195/w1080h715/20240720/56a2-25416cc3ecbb04c9542422ef095080af.png/w700d1q75cms.jpg)
联合太平洋公司的部分区域受到影响,团队和调度员之间的通信一度中断。
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/b06e-a54dee6ef97a182ea2763291f3ba6b0d.png/w700d1q75cms.jpg)
联邦快递表示,公司经历了严重故障,美国和欧洲的一些UPS计算机系统都受到影响。
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/5c82-8f53c8bb8d75b62066159fc2d2861dd2.png/w700d1q75cms.jpg)
在麻省布里格姆总医院,所有非紧急的手术、医疗就诊都被临时取消。
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/b355-5915a2a29547bcb2addc3d905bee4f20.png/w700d1q75cms.jpg)
英国吉尔福德皇家萨里医院直接宣布发生「严重事件」,医院的放射治疗IT系统Varian等都因此宕机。
英国国家卫生服务中心表示,大多数全科医生办公室都出现了服务中断。
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/675f-7eaa4ecdfb4b281d8f6a77fb5e760bd4.png/w700d1q75cms.jpg)
AWS的客户发现,一些使用了CrowdStrike的Windows Instances、Windows Workspaces和Appstream应用,都遇到了问题。
在亚马逊仓库,员工用来管理日程和提交休假申请的A to Z程序直接瘫痪了。可以提前支取收入的Anytime Pay内部服务,也无法使用。
亚马逊的货运业务也出中断了。使用Relay平台的卡车司机,则无法在仓库提货。
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/5fba-53b78128dd4d1c2b7aa70bab6a44f1f3.png/w700d1q75cms.jpg)
特斯拉部分工厂的生产线,也被迫停止了。服务器、笔记本电脑和制造设备,都发生了故障。
在南非的银行,服务也一度中断。
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/59dd-de08e69d99bd8a414e71b0fd605bf440.png/w700d1q75cms.jpg)
总之,银行、媒体、机场……全球范围内任何使用CrowdStrike的系统都逃不过。
![](http://k.sinaimg.cn/n/sinakd20240720s/591/w926h1265/20240720/2619-ed91c7a226f1f6092995982e335b7391.png/w700d1q75cms.jpg)
甚至,此事还惊动了美国总统和国土安全部。
![](http://k.sinaimg.cn/n/sinakd20240720s/760/w1036h524/20240720/1d1d-241c3368ed73da8ef844fe0982de4cc7.png/w700d1q75cms.jpg)
如何修复
目前,官方已经给出了两个推荐的解决方案。
其中一个是将系统回滚至0409 UTC前创建的snapshot,而另一个则是利用管理员权限进行修复:
1. 将Windows启动到安全模式或Windows恢复环境
2. 进入C:\Windows\System32\drivers\CrowdStrike目录
3. 找到匹配「C-00000291*.sys」的文件并删除
4. 正常启动电脑
听起来很简单,是吧?
然而,由于设备已经断联,这些操作都只能通过手动执行。
这意味着IT团队不仅需要在现实中找到受影响的远程电脑,而且还需要找到对应的Bitlocker恢复密钥。(如果存在主机里,那就直接死锁了)
![](http://k.sinaimg.cn/n/sinakd20240720s/456/w882h374/20240720/207b-b6c6ddde05115977b02b510456711f04.png/w700d1q75cms.jpg)
那么问题来了,那些部署在偏远地区,或者各种「犄角旮旯」的设备怎么办?
![](http://k.sinaimg.cn/n/sinakd20240720s/540/w1080h260/20240720/4bd7-3cd734779551b49bfd1240aa5ba38b25.png/w700d1q75cms.jpg)
详见官方说明:https://www.crowdstrike.com/blog/statement-on-falcon-content-update-for-windows-hosts/
挪威网络安全公司Promon的首席技术官Tom Lysemose Hansen表示,持续的全球IT故障可能并没有很简单的解决办法。
罪魁祸首是谁?
CrowdStrike于2011年成立,总部位于德克萨斯州奥斯汀,主营业务是为企业提供基于云的企业安全解决方案。
![](http://k.sinaimg.cn/n/sinakd20240720s/652/w929h523/20240720/63b1-36f471d9bb907a43685949c4979ab836.png/w700d1q75cms.jpg)
其中,一款名为Falcon的工具,可以通过识别异常行为和漏洞,来保护计算机系统免受恶意软件等威胁。而它正是周五全球大崩溃的原因。
![](http://k.sinaimg.cn/n/sinakd20240720s/200/w1080h720/20240720/78d8-f0826c3d2f6864d3d37ce657688c0a33.png/w700d1q75cms.jpg)
截至1月,CrowdStrike的业务已经遍及170多个国家,拥有29000个客户,其中500多家位列财富1000强。
世界上最大的科技公司如谷歌、亚马逊和英特尔,零售巨头Target,顶级F1车队梅赛德斯AMG,甚至美国50个州中的43个,都是它的客户。
![](http://k.sinaimg.cn/n/sinakd20240720s/20/w720h900/20240720/b478-bbc21706b8d6d3beb26bb790ab469ed7.png/w700d1q75cms.jpg)
在帮公司发现和防止安全漏洞方面上,CrowdStrike发挥着重要作用,自称拥有「最快的平均时间」来检测威胁。
自2011年成立以来,CrowdStrike已帮助调查了多起重大网络攻击,例如2014年索尼影业黑客攻击,以及2015年和2016年俄罗斯对民主党全国委员会的网络攻击。
截至周四晚间,CrowdStrike的估值还超过了830亿美元。
![](http://k.sinaimg.cn/n/sinakd20240720s/158/w1060h698/20240720/8d68-678a4580b6a1628bddbd2f3f81f267f8.png/w700d1q75cms.jpg)
CEO:已经在修了
对此,CrowdStrike创始人兼CEO在第一时间发文表达了诚挚的道歉,并表示公司已经动员了所有力量来帮助客户修复问题。
![](http://k.sinaimg.cn/n/sinakd20240720s/179/w864h115/20240720/0651-fbf1c9186081f3699584075e9fbe815a.png/w700d1q75cms.jpg)
官方通告:https://www.crowdstrike.com/blog/our-statement-on-todays-outage/
George Kurtz极力保证,公司正在「积极与受Windows主机单一内容更新中发现的缺陷影响的客户合作」,并强调Mac和Linux主机不会受到影响。
![](http://k.sinaimg.cn/n/sinakd20240720s/745/w477h268/20240720/3190-gif348407d50fcafcf74f759d1da3342996.gif/w700d1q75cms.jpg)
此外,他提醒客户保持警惕,在寻求支持时一定要和CrowdStrike的官方代表联系,因为「竞争对手和骗子会趁机出动」。
![](http://k.sinaimg.cn/n/sinakd20240720s/5/w875h730/20240720/e8b6-ad86176d2c465ed09d8b8e549f8ec78a.png/w700d1q75cms.jpg)
微软CEO纳德拉也发帖表示,微软正在跟CrowdStrike和整个行业密切合作,帮客户的系统恢复。
![](http://k.sinaimg.cn/n/sinakd20240720s/126/w877h849/20240720/ad88-7b2472c3a48e0930ce6a8d8c0df35ca3.png/w700d1q75cms.jpg)
软件工程师被困机场
32岁的游戏开发公司CTO Ahmed Al Sharif,有着近20年的软件工程师生涯。曾是初创公司的创始人,也曾在像EA和Meta这样的大厂工作过。
他原计划在当地时间上午11点从巴塞罗那飞往伦敦希思罗机场出差。
然而,到了机场之后,却惊讶地发现航班停飞了。
![](http://k.sinaimg.cn/n/sinakd20240720s/666/w1000h466/20240720/db33-b73d1e9acd0a91d873d37edcb63a7c4d.png/w700d1q75cms.jpg)
早有迹象
在早上8点出发前往机场时,他就已经发现自己无法登录网上银行应用程序,登录基于Outlook的电子邮件时速度也很慢。但他以为只是酒店的WiFi出了问题。
大约在早上8:20到达机场时,机场已经挤满了人。队伍非常长。几个值机柜台显示蓝屏,没有人能办理手续。
这时,他才意识到了事件的严重性:
「我不知道该排在哪里,当我问一位机场工作人员时,他们告诉我现在排队没有意义,因为票务、预订和订位系统都出了问题。」
混乱持续了一天
当天,机场的行李托运机、自动售货机和大多数显示屏都无法正常工作。
整个值机过程,都是手动进行的——
在拿到手写的纸质机票之前,必须向工作人员出示电子邮件作为付款证明,来证明确实预订了当天的航班。有托运行李的乘客都必须将行李带到登机口,然后机场工作人员手动将行李扔进货舱。
相比于那些早已在机场等了超过11个小时的人来说,他还是很幸运的——飞机最后「只」延误了6个小时。
![](http://k.sinaimg.cn/n/sinakd20240720s/641/w1000h441/20240720/1133-e4665f331aa53f6983919151bc844800.png/w700d1q75cms.jpg)
CrowdStrike如何踩在了微软身上?
虽然CrowdStrike在网络安全行业里非常有名,但直到今天,都没有人意识到它在Windows平台上的主导地位——区区一个第三方解决方案,竟能对所有Windows设备造成如此大的影响。
而且,作为软件开发的规则之一,不在周五推送修复可以说是基本「常识」了。(避免在周末召集大量的人力来处理因为更新而出现的问题)
如今,这个原则被CrowdStrike打破了。
Sharif认为,如果进行了更多的尽调,甚至让政府加入监管,这样的事件就不会发生。
独立网络安全研究员、《网络安全哲学》作者Lukasz Olejnik表示,「我们的软件是高度互连和相互依赖的。但这样就会存在很多单点故障,特别是当组织中存在软件单一文化时。」
网友狂欢
昨天下午,微软过得是十分煎熬。
![](http://k.sinaimg.cn/n/sinakd20240720s/391/w1036h955/20240720/94c9-a1eba74b6d836c6a5e2943fb3cff3925.png/w700d1q75cms.jpg)
但被微软意外提早解放了的打工人,则掀起了一场全球狂欢。
![](http://k.sinaimg.cn/n/sinakd20240720s/4/w785h819/20240720/ee4c-ae4ae5736a444ecd2f827aa1218051f8.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/775/w900h675/20240720/8a1b-c61cb73b1e5de11fd2831fd96b556abb.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/640/w960h1280/20240720/8298-f2d8c9ef940a1e77b2d53211852741d8.png/w700d1q75cms.jpg)
与此同时,网友们也纷纷在X上玩起了梗。
![](http://k.sinaimg.cn/n/sinakd20240720s/184/w884h900/20240720/8b2e-582513c2365bfe97f8022021a33c5bdf.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/640/w960h1280/20240720/5211-16a3aa1287027785ce1560f508828096.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/347/w560h587/20240720/d14c-gifb2d85df54c4968313f9accd360a01abb.gif/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/750/w480h270/20240720/7fcf-gifc1dd378c87369efb4245542b37ac209a.gif/w700d1q75cms.jpg)
回形针也被拉来做成了meme。
![](http://k.sinaimg.cn/n/sinakd20240720s/286/w500h586/20240720/99f6-6e5e4236437cd9f43556b8ddafd866be.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/763/w711h852/20240720/6312-31b9e2f8b6616eb29c6da883f88afb1f.png/w700d1q75cms.jpg)
当然,也会有一些打不开电脑的人变得十分暴躁。
![](http://k.sinaimg.cn/n/sinakd20240720s/80/w480h400/20240720/5944-gifd4942da96810ee4a386907ae08e501cd.gif/w700d1q75cms.jpg)
有人已经提前预判:又有实习生要背锅了。
![](http://k.sinaimg.cn/n/sinakd20240720s/48/w738h110/20240720/8625-3c43f6feb64ad5703309e9bad828238b.png/w700d1q75cms.jpg)
![](http://f.sinaimg.cn/sinakd20240720s/142/w480h462/20240720/3eef-gif212a7c79e34ef2a35e9ec995a36b088f.gif)
网友猜测,今天的CrowdStrike员工be like——
![](http://k.sinaimg.cn/n/sinakd20240720s/141/w461h480/20240720/4428-gifb118ca52122141aa80d48349f76f4928.gif/w700d1q75cms.jpg)
CEO马斯克一个上午转发了多张梗图,带头玩梗。
![](http://k.sinaimg.cn/n/sinakd20240720s/681/w1026h1255/20240720/c802-820c2816e2b9696068293dcadc0e153a.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/257/w1036h821/20240720/8e27-4f48b7e8217dd4de8e77374bfe236f70.png/w700d1q75cms.jpg)
Mac和Linux上大分。
![](http://k.sinaimg.cn/n/sinakd20240720s/183/w480h503/20240720/09a0-gifc053d2a983f9704a3f77ea5038b4a7e0.gif/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/594/w1034h1160/20240720/fca9-daa12dc2bf6fde0e6c14673a9afd7db9.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/599/w1047h1152/20240720/6678-436926f7142a79d8495e50b76b8bfece.png/w700d1q75cms.jpg)
![](http://k.sinaimg.cn/n/sinakd20240720s/165/w1024h741/20240720/7cd0-e4136fecea7cfd2584708a0692cb7e08.png/w700d1q75cms.jpg)
手写机票、手写病例算什么?手写二进制代码,才是最烧的。
![](http://k.sinaimg.cn/n/sinakd20240720s/108/w1080h1428/20240720/70e0-ef13105bffe5a9157f023b63426a2eaf.png/w700d1q75cms.jpg)
https://www.cnbc.com/2024/07/19/latest-live-updates-on-a-major-it-outage-spreading-worldwide.html?__source=iosappshare%7Ccom.apple.UIKit.activity.CopyToPasteboard
https://www.theverge.com/2024/7/19/24201864/crowdstrike-outage-explained-microsoft-windows-bsod
https://www.forbes.com/sites/emilsayegh/2024/07/19/widespread-technology-outages-and-the-imperative-for-ai-guardrails/
https://www.businessinsider.com/crowd-strike-outage-travel-chaos-tech-expert-2024-7
![](http://k.sinaimg.cn/n/sinakd20240720s/22/w1080h4542/20240720/3c94-cb37158840d9be37b43848129c85ffb7.png/w700d1q75cms.jpg)
![](http://n.sinaimg.cn/finance/pc/cj/kandian/img/article_pic05.png)
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有