硬核观察 #415 Facebook 宕机 6 小时,工程师一度无法远程和现场排除故障

2021-10-05
3分钟阅读时长

Facebook 宕机 6 小时,工程师一度无法远程和现场排除故障

美国东部时间周一上午 11:30 左右,Facebook 旗下的主要应用,包括 Facebook、Instagram、WhatsApp、Messenger 等从互联网上全部消失了 6 个小时左右。据 外界分析,是 Facebook 错误的 BGP 更新导致了问题,并因此阻止了对工程师们远程访问,无法及时进行恢复工作。不仅如此,其内部通信平台 Workplace 也因而下线,使他们之间难以及时联络。甚至工程师们无法接触到受影响的服务器,因为他们的数字身份认证系统同时也停止了工作。

根据 Facebook 二季度的财报,其每小时大约收入 1330 万美元,这意味着该事故导致 Facebook 至少损失了 8000 万美元的收入。并因此导致该公司股票被抛售,股票价格下跌了近 5%。据估计,该事故对全球经济总影响成本约为 9.68 亿美元。

老王点评:网络出问题时,一般都把锅丢给 DNS,但是其实更大的锅往往是 BGP 的,这个协议屡屡造成超大规模的网络问题。

Windows 11 正式发布,微软解释为何限制硬件

微软表示,符合 Windows 11 升级条件的现有 Windows 10 设备将从今天开始能够升级。

关于 Windows 11 最大的争议来自于其对硬件的硬性要求:需要较新的 CPU 和 TPM 2.0。微软对此解释称,“保证所有用户的计算机包含 TPM 也意味着可以确保每个应用程序开发人员现在都可以在硬件中存储证书和密钥。更多的应用程序可以默认支持无密码;更多的应用可以进行数据加密;更多的应用程序可以有零信任保护,因为我们已经有了基于虚拟化的能力来报告他们的完整性。”

此外,关于在 Windows 11 中默认开启的“基于虚拟化的安全”(VBS)功能,微软解释说,“我们从 Windows 10 中学到的是,如果你让安全设定变得可有可无,人们就不会把它们打开。这是一个很大的教训。有鉴于此,我们在 Windows 11 中将默认保护用户的安全。”他们在 Windows 11 中采用了和云计算相同的做法,即使有人获得了最高级别的权限,他们仍然无法读取独立的虚拟机中的内容。

老王点评:虽然我部分认同微软的安全观点,但是我觉得有一层微软没说的意思是,他们想推动人们买新的硬件。

Android 12 正式发布

谷歌宣布,已经将 Android 12 源代码推送到 Android 开源项目(AOSP),这也意味着 Android 12 正式发布。接下来的几周内到今年晚些之后,从 Pixel 开始,三星、一加、OPPO、realme、传音、vivo、小米等品牌设备将陆续升级 Android 12。Android 12 提供了更快、更高效的系统性能,改进了应用程序启动时间并优化了 I/O,以加快应用程序加载速度。此外,还提供了重新设计的小部件,更新了通知设计等界面变化。

老王点评:看来今天都是大消息,不过 Android 12 的影响要几个月甚至更长才能推送到终端用户。