ChatGPT遭遇近8小时大规模宕机

tamoadmin 0

当地时间6月4日(周二)下午,OpenAI的旗舰聊天机器人(300024)ChatGPT(包括网站、App和桌面应用)出现系统故障,导致全球数百万用户无***常使用,持续长达近8个小时。

OpenAI在其***上证实了此次系统宕机,称“我们经历了一次严重的服务中断,影响了所有的ChatGPT用户,但受影响的不包括 platform.openai*** 或API”。这意味着依赖OpenAI技术的第三方服务未受到影响,但OpenAI官方尚未公开具体的故障原因。

视觉中国图

ChatGPT遭遇近8小时大规模宕机
(图片来源网络,侵删)

ChatGPT中断期间,大量用户 转 向 Anthropic 公 司 的Claude、谷歌 Gemini 和 Perplexity等替代工具。其中,谷歌AI聊天机器人Gemini的搜索量激增至327058次,较5月4日至6月3日期间的204991次日均搜索量增长近60%。在流量激增之下,上述三大AI平台也遭遇了系统瘫痪,不过这些问题在几小时内迅速得到了解决。

对于此次AI服务器集体“***”的原因,有网友在X平台上发出疑问,还有网友表示这就像多米诺骨牌效应,一家公司算力不够导致其他公司访问量激增,从而集体瘫痪。

ChatGPT一天宕机两次

ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。当地时间周二下午,ChatGPT(包括网站、APP和桌面应用)出现系统故障。当时,在ChatGPT的主页面,提交按钮显示为灰色,用户无法给AI聊天机器人发送消息。随后,ChatGPT网站表示,服务已经满负荷,会在恢复服务时通知用户。

值得注意的是,ChatGPT在当天共发生了两次故障,首次故障出现在当日凌晨2点半左右,早上7点半左右OpenAI宣布故障已解决。然而,当日上午10点半左右,OpenAI报告正在调查第二次故障的原因,最终于当日下午1点左右,OpenAI宣布所有系统已恢复正常运行。也就是说,ChatGPT两次的宕机总时长近8个小时。

OpenAI的状态页面显示,该公司在过去90天内发生了十几次中断,但通常在不到一个小时的时间内就得到了解决,周二的故障是最严重的一次。

ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的全球中断,为所有依赖AI工具来支持业务的人敲响了警钟。想象一下,在产品发布等关键时刻失去对关键工具的访问权。这可能是毁灭性的!不要把所有的鸡蛋都放在一个篮子里,无论这个篮子有多大。”

据软件公司QRFY分析,在ChatGPT中断期间,谷歌AI聊天机器人Gemini的搜索量激增至327058次,较5月4日至6月3日期间的204991次日均搜索量增长近60%。该公司表示,“Microsoft Copilot”的搜索量也有所增长,但不如Gemini的搜索量增长那么显著。

QRFY首席执行官Marc Porcar指出,“ChatGPT中断和Gemini搜索量激增之间存在明显的平行趋势,这一事实表明人们认为Gemini是ChatGPT的明显替代品”。

AI服务器集体瘫痪

令人哭笑不得的是,在流量激增之下,Gemini、Claude和Perplexity也都遭遇了系统瘫痪,不过这些问题在几小时内迅速得到了解决。

瘫痪期间,Claude网站持续显示“服务器组件渲染时出现错误”,提醒用户系统正在处理中。Perplexity网站因为接收到太多请求,一度显示超出服务容量的信息,Perplexity提示用户:“我们很快回来”“我们现在收到很多问题,已经达到我们的处理能力(极限),请稍后再来。”Claude恢复正常工作后不久,Perplexity的网站也重新开始正常服务了。

对于此次AI服务器集体“***”的原因,有网友在X平台上发出疑问,“这是由于DDoS(分布式拒绝服务攻击)还是巧合”?还有网友表示这就像多米诺骨牌效应,一家公司算力不够导致其他公司访问量激增,从而集体瘫痪。

The Register报道称,根据受影响的用户的说法,宕机后ChatGPT无法响应用户的查询,这表明问题可能出在服务端的某个地方。当用户要求ChatGPT进行自我诊断时,其给出了一个简洁的回答――“内部服务器错误”。

《每日经济新闻》记者注意到,ChatGPT在2023年11月8日也曾遭遇宕机***,持续时间超过2小时。起初,OpenAI的CEO阿尔特曼将服务器不稳定归咎于OpenAI使用量“远超预期”,这也是外界的普遍解读,但当OpenAI及时修复了ChatGPT中断之后,才发现这个解释并不全面。

经过调查,OpenAI官方认为,当时ChatGPT和API遭遇的重大故障是由网络攻击造成的,这种攻击疑似为DDoS,一个黑客组织已宣称对此负责。

DDoS是网络攻击的一种,旨在让系统***消耗殆尽,使其无法回应服务请求。这种攻击由攻击者控制的大量受恶意软件感染的主机发起。DDoS之所以命名为“拒绝服务”,是因为会最终导致受害网站无法为用户提供服务,“分布式”则是指攻击的发出点分布在不同地方,攻击者可以有多个。

网络安全厂商StormWall的报告显示,2023年以来,DDoS攻击威胁不断升级,攻击量、强度和持续时间显著增长。

对于这类问题带来的管理责任,监测机构victoria ametrics的联合创始人Roman Kh***ronenko在X平台上发文称:“病毒式传播已经不再罕见,但能够处理病毒式传播流量的网站仍然太少了。如果数据是现代企业的命脉,为什么它仍然没有得到妥善管理?”

标签: #ChatGPT