
Sign up to save your podcasts
Or
今天咱们来聊个惊天大事件!昨天晚上,我正悠闲地刷着社交媒体,突然发现整个互联网都乱套了。不是开玩笑,三大云服务巨头AWS谷歌云Azure,再加上网络安全大亨Cloudflare,居然在同一时间集体宕机了!网友们炸开了锅,有人高呼互联网要废了,各种服务中断报告像雪片一样飞来。这场大崩盘可不是小事儿,它掀起了多米诺骨牌效应,让全球企业用户叫苦连天。今天,我就带大家深入扒一扒这场灾难的来龙去脉,看看背后的教训和那些让人哭笑不得的段子。
这事儿发生在北京时间昨天晚上,具体点说,是太平洋夏令时6月12日上午11点左右。当时,我在X平台上看到一堆用户吐槽,说AWS谷歌云Azure和Cloudflare的服务突然全挂了。宕机追踪网站Down Detector的数据瞬间飙升,谷歌云报告了超过13000起事件,AWS那边也闹了约5000起,Azure虽然少点,但也不甘落后。最搞笑的是,微软和AWS的官方状态页面还显示一切正常,这简直是自欺欺人嘛!与此同时,Character AI和OpenAI的ChatGPT也跟着遭殃,OpenAI官方在社交媒体上承认,单点登录出了大问题,工程团队忙得焦头烂额。还有Gemini Pro和Cursor这些AI工具,用户反馈错误连连,真是雪上加霜。
谷歌云作为这场大戏的主角,宕机最惨烈,足足持续了三个小时。太平洋夏令时上午1051开始,谷歌云的状态页面就亮起红灯,宣布多个GCP产品遭遇服务问题。影响范围之大,让人咋舌GmailGoogle CalendarGoogle DocsGoogle DriveGoogle Meet,甚至连Google Voice都没能幸免。Workspace产品全军覆没,用户连个邮件都发不出去。工程团队急得像热锅上的蚂蚁,却迟迟找不到解决方案。10多分钟后,谷歌更新说客户仍在遭受不同程度的影响,但修复时间未知。这感觉就像坐过山车,用户们只能干等着。
终于,在太平洋夏令时下午1241,谷歌宣布找到了根本原因,采取了缓解措施。原来,问题出在身份和访问管理服务IAM上,导致底层依赖关系崩溃。谷歌报告说,除uscentral1地区外,其他位置开始恢复,但效果参差不齐。下午1400,他们又更新称在多个美国地区看到了恢复迹象,预计一小时内搞定。但别高兴太早,一些服务如Google Cloud Dataflow和Vertex AI还在挣扎,用户抱怨延迟和5xx错误。直到下午1827,谷歌云才正式宣布所有服务恢复正常。这三个小时的瘫痪,对企业来说简直是噩梦。想象一下,员工们不能协作办公,项目停滞,损失惨重。有用户调侃说这时间足够我刷完整部剧了!哈哈,但对企业来说,这可不是娱乐时间。
宕机的影响远不止谷歌自家产品,它像病毒一样扩散到第三方服务。电子商务巨头Shopify是谷歌云的大客户,太平洋夏令时下午215左右,他们的Down Detector报告暴增,服务瘫痪持续了三个小时以上,后续问题还拖了好一阵。用户在X上哀嚎我的网店订单全卡住了,损失上万!Cloudflare更惨,他们明明是网络安全专家,却栽在谷歌云的依赖上。Cloudflare发言人在接受媒体采访时承认,少数服务因谷歌云中断而故障,包括Workers KV服务,导致AccessWARPRealtimeWorkers AI等产品歇菜。有趣的是,Cloudflare早在太平洋夏令时1119就报告问题,比谷歌还早,这说明他们先感受到了连锁反应。CTO Dane Knecht事后在X上道歉,说让客户失望了,承诺发事后分析报告。Cloudflare股价因此暴跌5,这经济损失可不小啊。
为什么会出现这种大崩盘?公众猜测纷纷,Hacker News和X平台成了讨论热点。有内行爆料,问题可能源于谷歌内部的一个叫Chemist的服务故障。Chemist负责检查策略,比如项目状态和计费,它一瘫痪,整个GCP网络就乱套。用户评论说多个互联网服务都跟着倒了,Chemist像是引爆点。还有人提到Uber前员工Gergely的观察,他在宕机前两天就嗅到异常,看到ChatGPTHerokuNVIDIA等服务相继中断。他指出,GCP和Cloudflare同时宕机前所未见,因为Cloudflare一向以高弹性设计著称,这次却栽了。媒体The Register分析,这是经典的多米诺骨牌效应谷歌倒,Cloudflare跟着倒,最终客户受罪。网友们议论纷纷,有人惊叹Cloudflare产品居然这么依赖谷歌云,太意外了!还有人忧虑云服务巨头相互依赖,哪天互联网真崩了,我们连重启都不知道咋办。最幽默的是,Hacker News上有人调侃AI宕机前说AI是幻觉,宕机后才发现我们才是牛马!笑死我了,这讽刺真到位。
当然,宕机背后还有深层原因。谷歌云部门在CEO托马斯库里安领导下,受益于AI热潮高速增长,但这次事件暴露了潜在问题。据CNBC报道Alphabet近期大幅降本增效,裁员销售和客户体验团队,甚至还推自愿离职计划,将部分岗位迁到印度和墨西哥城。这引发了成本削减导致服务不稳定的猜测。谷歌状态页面显示,宕机波及13个云服务区域,包括欧洲和亚洲。影响的企业名单长得吓人SpotifyAWS的TwitchCoreWeave的Weights BiasesGitLabLangChain微软的GitHubReplit和Intuit的Mailchimp。宕机不仅打击谷歌声誉,还让其在云市场与AWSAzure的竞争中处劣势。企业用户纷纷反思过度依赖单一云服务是否明智?未来得多用混合云策略分散风险。
总结一下,这场谷歌云主导的大瘫痪,给互联网上了生动一课技术巨头并非无敌,相互依赖可能变成致命弱点。作为敢想老田,我建议大家从中吸取教训企业应该多元化云服务供应商,个人用户备好离线工具。谷歌和Cloudflare的道歉和事后分析,希望能推动改进。不然,下次再崩,互联网真可能玩完!好了,今天聊到这里,下回见,记得保持冷静,别让AI牵着鼻子走
今天咱们来聊个惊天大事件!昨天晚上,我正悠闲地刷着社交媒体,突然发现整个互联网都乱套了。不是开玩笑,三大云服务巨头AWS谷歌云Azure,再加上网络安全大亨Cloudflare,居然在同一时间集体宕机了!网友们炸开了锅,有人高呼互联网要废了,各种服务中断报告像雪片一样飞来。这场大崩盘可不是小事儿,它掀起了多米诺骨牌效应,让全球企业用户叫苦连天。今天,我就带大家深入扒一扒这场灾难的来龙去脉,看看背后的教训和那些让人哭笑不得的段子。
这事儿发生在北京时间昨天晚上,具体点说,是太平洋夏令时6月12日上午11点左右。当时,我在X平台上看到一堆用户吐槽,说AWS谷歌云Azure和Cloudflare的服务突然全挂了。宕机追踪网站Down Detector的数据瞬间飙升,谷歌云报告了超过13000起事件,AWS那边也闹了约5000起,Azure虽然少点,但也不甘落后。最搞笑的是,微软和AWS的官方状态页面还显示一切正常,这简直是自欺欺人嘛!与此同时,Character AI和OpenAI的ChatGPT也跟着遭殃,OpenAI官方在社交媒体上承认,单点登录出了大问题,工程团队忙得焦头烂额。还有Gemini Pro和Cursor这些AI工具,用户反馈错误连连,真是雪上加霜。
谷歌云作为这场大戏的主角,宕机最惨烈,足足持续了三个小时。太平洋夏令时上午1051开始,谷歌云的状态页面就亮起红灯,宣布多个GCP产品遭遇服务问题。影响范围之大,让人咋舌GmailGoogle CalendarGoogle DocsGoogle DriveGoogle Meet,甚至连Google Voice都没能幸免。Workspace产品全军覆没,用户连个邮件都发不出去。工程团队急得像热锅上的蚂蚁,却迟迟找不到解决方案。10多分钟后,谷歌更新说客户仍在遭受不同程度的影响,但修复时间未知。这感觉就像坐过山车,用户们只能干等着。
终于,在太平洋夏令时下午1241,谷歌宣布找到了根本原因,采取了缓解措施。原来,问题出在身份和访问管理服务IAM上,导致底层依赖关系崩溃。谷歌报告说,除uscentral1地区外,其他位置开始恢复,但效果参差不齐。下午1400,他们又更新称在多个美国地区看到了恢复迹象,预计一小时内搞定。但别高兴太早,一些服务如Google Cloud Dataflow和Vertex AI还在挣扎,用户抱怨延迟和5xx错误。直到下午1827,谷歌云才正式宣布所有服务恢复正常。这三个小时的瘫痪,对企业来说简直是噩梦。想象一下,员工们不能协作办公,项目停滞,损失惨重。有用户调侃说这时间足够我刷完整部剧了!哈哈,但对企业来说,这可不是娱乐时间。
宕机的影响远不止谷歌自家产品,它像病毒一样扩散到第三方服务。电子商务巨头Shopify是谷歌云的大客户,太平洋夏令时下午215左右,他们的Down Detector报告暴增,服务瘫痪持续了三个小时以上,后续问题还拖了好一阵。用户在X上哀嚎我的网店订单全卡住了,损失上万!Cloudflare更惨,他们明明是网络安全专家,却栽在谷歌云的依赖上。Cloudflare发言人在接受媒体采访时承认,少数服务因谷歌云中断而故障,包括Workers KV服务,导致AccessWARPRealtimeWorkers AI等产品歇菜。有趣的是,Cloudflare早在太平洋夏令时1119就报告问题,比谷歌还早,这说明他们先感受到了连锁反应。CTO Dane Knecht事后在X上道歉,说让客户失望了,承诺发事后分析报告。Cloudflare股价因此暴跌5,这经济损失可不小啊。
为什么会出现这种大崩盘?公众猜测纷纷,Hacker News和X平台成了讨论热点。有内行爆料,问题可能源于谷歌内部的一个叫Chemist的服务故障。Chemist负责检查策略,比如项目状态和计费,它一瘫痪,整个GCP网络就乱套。用户评论说多个互联网服务都跟着倒了,Chemist像是引爆点。还有人提到Uber前员工Gergely的观察,他在宕机前两天就嗅到异常,看到ChatGPTHerokuNVIDIA等服务相继中断。他指出,GCP和Cloudflare同时宕机前所未见,因为Cloudflare一向以高弹性设计著称,这次却栽了。媒体The Register分析,这是经典的多米诺骨牌效应谷歌倒,Cloudflare跟着倒,最终客户受罪。网友们议论纷纷,有人惊叹Cloudflare产品居然这么依赖谷歌云,太意外了!还有人忧虑云服务巨头相互依赖,哪天互联网真崩了,我们连重启都不知道咋办。最幽默的是,Hacker News上有人调侃AI宕机前说AI是幻觉,宕机后才发现我们才是牛马!笑死我了,这讽刺真到位。
当然,宕机背后还有深层原因。谷歌云部门在CEO托马斯库里安领导下,受益于AI热潮高速增长,但这次事件暴露了潜在问题。据CNBC报道Alphabet近期大幅降本增效,裁员销售和客户体验团队,甚至还推自愿离职计划,将部分岗位迁到印度和墨西哥城。这引发了成本削减导致服务不稳定的猜测。谷歌状态页面显示,宕机波及13个云服务区域,包括欧洲和亚洲。影响的企业名单长得吓人SpotifyAWS的TwitchCoreWeave的Weights BiasesGitLabLangChain微软的GitHubReplit和Intuit的Mailchimp。宕机不仅打击谷歌声誉,还让其在云市场与AWSAzure的竞争中处劣势。企业用户纷纷反思过度依赖单一云服务是否明智?未来得多用混合云策略分散风险。
总结一下,这场谷歌云主导的大瘫痪,给互联网上了生动一课技术巨头并非无敌,相互依赖可能变成致命弱点。作为敢想老田,我建议大家从中吸取教训企业应该多元化云服务供应商,个人用户备好离线工具。谷歌和Cloudflare的道歉和事后分析,希望能推动改进。不然,下次再崩,互联网真可能玩完!好了,今天聊到这里,下回见,记得保持冷静,别让AI牵着鼻子走