June 14, 2025

三大云巨头集体瘫痪！谷歌云全球宕机三小时，互联网陷入瘫痪漩涡

7 minutes

今天咱们来聊个惊天大事件！昨天晚上，我正悠闲地刷着社交媒体，突然发现整个互联网都乱套了。不是开玩笑，三大云服务巨头AWS谷歌云Azure，再加上网络安全大亨Cloudflare，居然在同一时间集体宕机了！网友们炸开了锅，有人高呼互联网要废了，各种服务中断报告像雪片一样飞来。这场大崩盘可不是小事儿，它掀起了多米诺骨牌效应，让全球企业用户叫苦连天。今天，我就带大家深入扒一扒这场灾难的来龙去脉，看看背后的教训和那些让人哭笑不得的段子。

这事儿发生在北京时间昨天晚上，具体点说，是太平洋夏令时6月12日上午11点左右。当时，我在X平台上看到一堆用户吐槽，说AWS谷歌云Azure和Cloudflare的服务突然全挂了。宕机追踪网站Down Detector的数据瞬间飙升，谷歌云报告了超过13000起事件，AWS那边也闹了约5000起，Azure虽然少点，但也不甘落后。最搞笑的是，微软和AWS的官方状态页面还显示一切正常，这简直是自欺欺人嘛！与此同时，Character AI和OpenAI的ChatGPT也跟着遭殃，OpenAI官方在社交媒体上承认，单点登录出了大问题，工程团队忙得焦头烂额。还有Gemini Pro和Cursor这些AI工具，用户反馈错误连连，真是雪上加霜。

谷歌云作为这场大戏的主角，宕机最惨烈，足足持续了三个小时。太平洋夏令时上午1051开始，谷歌云的状态页面就亮起红灯，宣布多个GCP产品遭遇服务问题。影响范围之大，让人咋舌GmailGoogle CalendarGoogle DocsGoogle DriveGoogle Meet，甚至连Google Voice都没能幸免。Workspace产品全军覆没，用户连个邮件都发不出去。工程团队急得像热锅上的蚂蚁，却迟迟找不到解决方案。10多分钟后，谷歌更新说客户仍在遭受不同程度的影响，但修复时间未知。这感觉就像坐过山车，用户们只能干等着。

终于，在太平洋夏令时下午1241，谷歌宣布找到了根本原因，采取了缓解措施。原来，问题出在身份和访问管理服务IAM上，导致底层依赖关系崩溃。谷歌报告说，除uscentral1地区外，其他位置开始恢复，但效果参差不齐。下午1400，他们又更新称在多个美国地区看到了恢复迹象，预计一小时内搞定。但别高兴太早，一些服务如Google Cloud Dataflow和Vertex AI还在挣扎，用户抱怨延迟和5xx错误。直到下午1827，谷歌云才正式宣布所有服务恢复正常。这三个小时的瘫痪，对企业来说简直是噩梦。想象一下，员工们不能协作办公，项目停滞，损失惨重。有用户调侃说这时间足够我刷完整部剧了！哈哈，但对企业来说，这可不是娱乐时间。

宕机的影响远不止谷歌自家产品，它像病毒一样扩散到第三方服务。电子商务巨头Shopify是谷歌云的大客户，太平洋夏令时下午215左右，他们的Down Detector报告暴增，服务瘫痪持续了三个小时以上，后续问题还拖了好一阵。用户在X上哀嚎我的网店订单全卡住了，损失上万！Cloudflare更惨，他们明明是网络安全专家，却栽在谷歌云的依赖上。Cloudflare发言人在接受媒体采访时承认，少数服务因谷歌云中断而故障，包括Workers KV服务，导致AccessWARPRealtimeWorkers AI等产品歇菜。有趣的是，Cloudflare早在太平洋夏令时1119就报告问题，比谷歌还早，这说明他们先感受到了连锁反应。CTO Dane Knecht事后在X上道歉，说让客户失望了，承诺发事后分析报告。Cloudflare股价因此暴跌5，这经济损失可不小啊。

为什么会出现这种大崩盘？公众猜测纷纷，Hacker News和X平台成了讨论热点。有内行爆料，问题可能源于谷歌内部的一个叫Chemist的服务故障。Chemist负责检查策略，比如项目状态和计费，它一瘫痪，整个GCP网络就乱套。用户评论说多个互联网服务都跟着倒了，Chemist像是引爆点。还有人提到Uber前员工Gergely的观察，他在宕机前两天就嗅到异常，看到ChatGPTHerokuNVIDIA等服务相继中断。他指出，GCP和Cloudflare同时宕机前所未见，因为Cloudflare一向以高弹性设计著称，这次却栽了。媒体The Register分析，这是经典的多米诺骨牌效应谷歌倒，Cloudflare跟着倒，最终客户受罪。网友们议论纷纷，有人惊叹Cloudflare产品居然这么依赖谷歌云，太意外了！还有人忧虑云服务巨头相互依赖，哪天互联网真崩了，我们连重启都不知道咋办。最幽默的是，Hacker News上有人调侃AI宕机前说AI是幻觉，宕机后才发现我们才是牛马！笑死我了，这讽刺真到位。

当然，宕机背后还有深层原因。谷歌云部门在CEO托马斯库里安领导下，受益于AI热潮高速增长，但这次事件暴露了潜在问题。据CNBC报道Alphabet近期大幅降本增效，裁员销售和客户体验团队，甚至还推自愿离职计划，将部分岗位迁到印度和墨西哥城。这引发了成本削减导致服务不稳定的猜测。谷歌状态页面显示，宕机波及13个云服务区域，包括欧洲和亚洲。影响的企业名单长得吓人SpotifyAWS的TwitchCoreWeave的Weights BiasesGitLabLangChain微软的GitHubReplit和Intuit的Mailchimp。宕机不仅打击谷歌声誉，还让其在云市场与AWSAzure的竞争中处劣势。企业用户纷纷反思过度依赖单一云服务是否明智？未来得多用混合云策略分散风险。

总结一下，这场谷歌云主导的大瘫痪，给互联网上了生动一课技术巨头并非无敌，相互依赖可能变成致命弱点。作为敢想老田，我建议大家从中吸取教训企业应该多元化云服务供应商，个人用户备好离线工具。谷歌和Cloudflare的道歉和事后分析，希望能推动改进。不然，下次再崩，互联网真可能玩完！好了，今天聊到这里，下回见，记得保持冷静，别让AI牵着鼻子走

...more

View all episodes

By 无何有老田

June 14, 2025

三大云巨头集体瘫痪！谷歌云全球宕机三小时，互联网陷入瘫痪漩涡

7 minutes

...more

Share 三大云巨头集体瘫痪！谷歌云全球宕机三小时，互联网陷入瘫痪漩涡

Sign up to save your podcasts

三大云巨头集体瘫痪！谷歌云全球宕机三小时，互联网陷入瘫痪漩涡

三大云巨头集体瘫痪！谷歌云全球宕机三小时，互联网陷入瘫痪漩涡