连续大宕机引发的网络系统韧性思考—— 互联网:强大到无所不能,脆弱得令人发抖

作者:lhl来源:发表时间:2026-01-27阅读次数:145

岁末年初,很多人忙着上网抢票、买年货、联系亲友……网络生活,人们早习以为常,但很多人意识不到它其实也很脆弱。

就在2025年四季度,全球互联网又接连宕机——

10月,全球主要云服务提供商之一的亚马逊AWS出现故障,导致多地航班延误、银行瘫痪、公共服务网页空白,数百万用户受影响;11月,互联网基础设施服务商Cloudflare一次软件升级事故,致使“半个互联网停摆”;12月,短视频平台快手遭受大规模网络攻击,造成国内直播行业首次因外部攻击导致“休克”……

当今,数字经济已占全球主要国家GDP比重的一半,人工智能以空前速度渗透社会生活各个角落,互联网为何依然如此——强大,却又脆弱?

一张绷到极限的网

如同希腊神话中的英雄阿喀琉斯,互联网的强大与脆弱,几乎与生俱来。

其强大,因深刻改变了人们的工作与生活方式而广受信赖。记者调查发现,这在电商行业、网络博主、“Z世代”群体中尤为明显。

在义乌国际商贸城经营了20多年的老陆感叹:“以前是人追着生意跑,现在是生意顺着网线来。”绍兴的95后二次元博主小强说得更直白:“网络开启了我的‘第二人生’。”

类似转变,在互联网诞生的40多年间不断上演。国际电信联盟此前报告预测,2025年全球互联网用户将达60亿。

“互联网打破了时空限制,深刻改写了全球政治、经济、文化的运行逻辑。它不再是工具,而是支撑整个数字时代运转的核心社会操作系统。”浙江大学传媒与国际文化学院常务副院长、临空智能媒体研究院院长方兴东这样评价。

近年来,浙江借互联网之力,迈向全球数字变革高地:数字经济增加值连续多年保持两位数增长,2024年占GDP比重已达53.3%。一个“浙里办”App集纳了3600余项依申请政务服务事项、2000余项便民惠企服务,吸引超1.3亿用户实名注册,每天300万以上人次登录办理业务……

“互联网一直在进步,强大是常态,脆弱是意外。这容易让人忽视它也有‘阿喀琉斯之踵’。”上海财经大学特聘教授胡延平解释,现代互联网分应用、系统、数据、协议、物理五层架构,各层实时联动、环环相扣,既能让信息秒达全球,也会让单一故障在数秒内扩散至全世界。

Cloudflare这家企业,服务覆盖120多个国家和地区,直连1.3万个以互联网服务提供商、云提供商和企业为主的网络,其升级失误15分钟内就被推向全球。

“简直是一场噩梦。”跨境电商商户大毛这样形容宕机事件的影响:客户提交订单被卡死,后台停滞,无法支付,“我估算,一晚上错过了十几万元的订单。”

安恒信息研究院院长王欣形容,互联网对极致效率和极致连接的追求,以及越来越复杂的系统集成链路,已经把自己变成了一根绷到极限的弦,任何微小扰动,都可能引发全局震荡。

“很多互联网企业早已不是普通服务商,而是数字化的‘水电煤供应商’,一出问题就像主干电网跳闸。”同济大学电信学院研究员吴迪认为,网络一旦崩溃,影响的不仅是效率,甚至可能动摇公共信任与社会秩序。

代码无辜,“埋雷”的是人

2026年被视为AI大规模落地之年。有人为AI与互联网的强强联合而欢呼,但也有人担忧:网络的脆弱是否会被AI进一步放大?

“在强大的技术面前,互联网可谓‘漏洞百出’。关键就在于这些漏洞是否暴露、是否被恶意利用。”专家指出,网络崩溃背后,除了光纤被挖断、火灾、断电等意外,人为因素已成为最大变量。

调研中,有网民问:当年“熊猫烧香”、蠕虫病毒等攻击令人闻之色变,但如今个人电脑中毒崩溃却鲜有发生。是网络变好了吗?

阿里巴巴高级安全专家卢彬良解释,近年来,网络安全法等法律法规相继出台,执法打击力度明显增强。国家持续加强网络空间治理,推动关键信息基础设施保护等制度落地,构建起一套严密的防控体系。个人电脑中的软硬件及安全防护机制也一直在迭代升级,网络空间确实清朗起来。

但他也提醒,黑灰产一直没有消失,只是攻击方向转向了金融诈骗、企业数据窃取、平台生态破坏等获利更大的领域。这类攻击更隐蔽,危害也更大。

两个月前,公安部网安局预警称,以“银狐”木马为代表的恶意程序变种频发,已导致全国1000余家企业累计损失超20亿元。

“黑灰产形成了一条产业链。”网络安全企业微步在线市场负责人樊江波介绍,随着AI快速发展,黑灰产已进入“自动化攻击”时代:租用每小时花费不足1美元的廉价云主机,训练AI脚本模拟真人行为进行攻击,通过加密货币洗钱……每次攻击成本不足万元,造成的经济损失可能高达数亿元。

更严峻的隐患,来自地缘政治波动。

全球互联网的运行,离不开分布在美、欧、日等地的13台根服务器。科幻电影《流浪地球2》里有个“重启全球互联网”的经典情节,重启的核心设备正是根服务器。

“有些国家把关闭根服务器作为威胁手段。各界都应极力避免类似事件发生。”乌镇数字文明研究院副院长司新颖说。

如果说恶意攻击令人愤慨,一些企业的“无心之失”甚至“有意忽略”更值得反思。

近年来,微软、亚马逊等厂商发生故障,最受诟病的还不是技术复杂性,而是管理疏漏。

“系统的日常维护应先做灰度测试,通过小范围验证规避风险。Cloudflare这次出事,正是跳过了这一环节,直接在运行环境中更新。相当于本该断电维修的,却带电作业。”有专家分析,这或许是大企业病的体现——部门间协作不足,难以兼顾全局。

杭州城市大脑有限公司总经理申永生从成本角度补充:“灰度测试需要时间、人力和算力成本,部分平台运营者也会在效率与安全之间做出短视选择。”

为了抢占“双11”“黑五”等大促窗口,跳过灰度测试;为了迎合用户体验,关闭二次验证;为了节省成本,不做异地灾备……这些看似“合理”的决策,在危机时刻却成为致命短板。一名电商技术负责人私下坦言:“每次大促前,安全团队都会提示风险,但业务压力太大,常常是赌一把。”

另一大隐患,就是“中心化依赖”。马太效应下,头部壁垒越高,客户越不敢离开。吴迪解释,覆盖全球的节点网络需要长期投入、复杂调度与稳定客源,规模效应又让它们能以更低成本提供更优服务,客户出于风控考虑,也更倾向于选择头部企业。

如何重建“数字免疫力”

2025年12月1日,是全球电商促销日“网络星期一”。电商平台巨头Shopify突然“心脏骤停”,影响到500多万商家。一些商家因做好备份、准备了应急通道,度过了这次危机。

“要相信互联网,更要相信人类的智慧。”多位专家指出,互联网具备很强的鲁棒性(Robustness)——一种在异常输入、硬件故障等干扰下仍能保持运行的能力。

用好AI等先进技术,无疑是提升鲁棒性的“硬”招数。

2023年,安恒信息提出“AI对抗AI,AI管理AI”,并在2025年哈尔滨亚冬会期间经受实战考验:通过部署“恒脑”安全智能体,实现7×24小时智能拦截、溯源与反制,累计阻断攻击超27万次,实现网络安全“零事故”。

“AI既能升级传统安全产品,变被动防御为主动反制,也能以‘AI+’赋能行业,构建‘硬件+软件’的多重防护体系。”王欣介绍,该公司还推出安全服务数字人“安小龙”,辅助普通工程师获得专家级分析处置能力。

多年来,全球互联网顶级域服务器规模故障这一重大隐患一直存在。浙江移动网络专家许乐静介绍,该公司首创了全天候互联网域名冗灾应急服务体系,当互联网根节点无法访问时,系统会立即切换到冗灾应急保障平台,在1分钟内切换并接管万亿域名服务,确保网络不会瘫痪。该系统上线400多天以来,一直在稳定运行。

近日,《浙江省“十五五”数字经济和数字基础设施规划(征求意见稿)》公布。其中“按需建设边缘算力节点”等部署引发关注。

司新颖介绍,边缘计算的“边缘”,可能是一部智能手机、一辆自动驾驶车辆或一个街角基站,是互联网“去中心化”的重要手段,“好比从前全村只有一部公共电话,现在人人用上了手机。这些新技术应尽快实现规模化部署,才能真正发挥作用。”

完善管理制度、强化安全意识同等重要。

2025年初,欧盟《数字运营弹性法案》正式生效。它强制金融、能源、医疗等关键平台每年进行压力测试与灾备演练。美国也在实行“网络盾牌”等行动,以建立国家级威胁情报共享平台。中国除在技术发力之外,还制定了网络安全法、数据安全法、个人信息保护法等法律法规,实施“护网”系列等专项行动,推动构建网络空间命运共同体。

调研中,专家介绍了行业一些共性难题:跨主体协同机制滞后,安全事件平均响应时间延长;物联网、工业互联网等新场景监测体系尚未完善;中小企业投入有限,成为产业链上的“安全洼地”……

“发现风险隐患,才能将其解除。我们还是要集中力量,加强威胁检测与响应能力建设。”樊江波建议,增加对基础设施相关网络安全的投入,提升预警水平;构建良性产业生态,扶持新技术新产品的研发和落地;加强跨部门、跨地区间的合作,形成长期可持续的联防联控体系。

在杭州市数据局,记者看到了一张“两地三中心”布局示意图:杭州市区两处机房,具备同等业务处理能力并实时同步数据,实现重要应用同城应用级“双活”接入,一处故障,另一处可无缝接管;同时还设有异地数据级灾备中心,以应对极端情况。

“政府、企业和个人都应结合成本与风险做好备份。”专家们提醒。记者发现,电商平台上一两千元价位的“私有云”产品已不少见,颇受市场欢迎。

“软件更新别太频繁。”有企业主和网民想以此避免因更新引发的网络崩溃。

卢彬良建议,不要一刀切,可以结合稳定性与运维成本分类处理:安全漏洞类更新需优先响应,及时打上漏洞的补丁。纯功能性更新可先做需求和安全评估,觉得有必要且安全再执行。

腾讯安全专家表示,黑灰产攻击的关注点已从个人电脑转向手机、智能家居等移动端和物联网设备这片更广阔、防护有时更薄弱的新“战场”,“网络安全防护要从‘修一家的围墙’升级为‘区域联防’。”

“互联网安全防护,应在数智基础设施的整体框架下,探索面向未来的系统解决方案。”胡延平建议,政府部门应提升数字基础设施在公共安全布局中的权重,构建覆盖“预研、预判、预警、预防”的系统性防线;鼓励核心技术攻关,推动全产业链安全能力提升;针对“既懂AI又懂安全的复合型人才紧缺”等瓶颈,鼓励高校与企业加强合作,完善交叉学科建设,搭建以龙头企业为核心的人才培育生态。

一部全球互联网发展史,也是淬炼系统韧性的进化史。