这些年来,虽然苹果Pro系列强势崛起,销量远超标准版,比如今年16国内销量700万台、Pro系列销量2700万台,看起来感觉标准版好像快要掉链子了,但...
2025-09-17 0
【摘要】一场由大模型引爆的算力革命,正从单芯片的物理极限走向超节点的系统级创新,AI基础设施的竞争法则迎来新一轮重构。
从华为的全对等互联、壁仞科技的光互连突破,到浪潮信息的“元脑”商用部署,再到无问芯穹的生态共建,一场由硬件到软件、由单点突破到系统协同的智算革命,正在全面加速。
以下为正文:
01
超节点兴起
近年来,DeepSeek-R1、Qwen3、MiniMax-VL-01、GLM 4.5等开源模型频繁涌现,各厂商开启大模型竞赛,算力需求走向新高,AI基础正面临前所未有的挑战。
麦肯锡研究报告预测,到2030年,全球数据中心投资规模或达6.7万亿美元,其中5.2万亿美元将用于支持人工智能算力需求,推动数据中心总装机容量增至219GW。
与此同时,单芯片的显存与带宽愈发难以支撑万亿参数大模型,大模型推理的实时性要求又与多卡互联长链路的延迟性产生冲突,由此,超节点架构成为应对性能瓶颈、响应市场需求的关键。
当前,超节点技术可突破单服务器限制,并通过NVLink/UB等高速互联技术,将GPU间通信时延压缩至百纳秒级,极大提升资源调度效率。
在2025世界人工智能大会上,华为、中兴、新华三、超聚变等中国企业纷纷推出智算超节点方案。
其中,华为昇腾384超节点(Atlas 900 A3 SuperPoD)是这一架构的典型代表,其集成了384个昇腾 910C 神经网络处理单元(NPU)和192个鲲鹏920中央处理器(CPU),采用华为自研的MatrixLink高速互联技术,实现全对等互联。
根据官方数据,在昇腾超节点集群上,LLaMA 3等千亿稠密模型性能相比传统集群提升2.5倍以上,在通信占比更高的Qwen、DeepSeek等多模态、MoE模型上,可以达到3倍以上的提升。
2025年,超节点已成为智算中心的核心架构,从互联网巨头到电信运营商,从创业公司到芯片龙头,无不在这场变革中重新寻找自己的位置。
02
从传输到散热
技术实现角度,想要扩大超节点规模,首先需要增加机柜与服务器连接数量。
而与传统的铜缆相比,光缆具有远距离传输优势,可实现数据交付与机柜解耦与万卡级弹性拓展,兼容现有机房设施降低部署成本,并按算力需求动态调整超节点规模,实现分阶段建设。
基于此,业内头部公司正在合作解决这一问题。
今年7月,曦智科技、壁仞科技、中兴通讯联合推出光跃LightSphere X,成为全球首个分布式光互连光交换GPU超节点解决方案,并获得2025 WAIC SAIL大奖。
据悉,该超节点基于曦智科技全球首创的分布式光交换技术,采用硅光技术的光互连光交换芯片,搭配壁仞科技自主原创架构的大算力通用GPU液冷模组与全新载板,并搭载中兴通讯高性能AI国产服务器及仪电智算云平台软件。
目前,曦智科技已与国内领先的光/电晶圆厂、光/电封装厂、算力/交换芯片厂商、系统厂商等建立起全方位、多层次的战略合作关系。
通过产业链上下游的深度协同与联合技术攻关,公司在超节点建设、CPO等关键领域实现多项突破。这一紧密协作的体系不仅显著提升了产品兼容性与系统效能,也实现了从核心器件到算力基础设施的全链路协同优化,也为构建高效、开放、安全的新一代算力生态奠定了坚实基础。
整个系统中,壁仞科技承担关键的动力引擎角色,其产品不是普通的显卡GPU,而是用于AI训练、高性能计算等领域的超级计算芯片,计算能力非常强大,加上业内伙伴的加持,计算单元性能效率极高,特别适用于需要处理海量数据的场景。光跃LightSphere X方案也即将于上海仪电智算中心落地,计划实现数千卡规模商业化部署。
此前壁仞科技相关负责人透露,从光直连技术到光互连光交换OCS GPU超节点,这已经是壁仞和曦智两家合作实现的第三代产品。据悉,壁仞在第一代产品上便已实现真正意义上的超节点。
针对包含Deepseek的大模型训练与推理需求,该方案可显著缩短训练时间、提升算力利用率并降低算力成本。与此同时,作为上海的标杆项目,该方案将有效推动上海本地光芯片、液冷技术、GPU模组等产业的协同发展,迅速形成“技术-产品-服务”的闭环生态。
此外,光交换芯片的低功耗特性及液冷技术的应用,能够助力数据中心绿色转型,也符合国家“双碳”目标。
这一案例也可看出,超节点的散热正逐渐从传统风冷走向液冷。
IDC数据显示,中国液冷服务器市场在2024年市场规模达到23.7亿美元,同比增长67.0%,预计2024-2029年,中国液冷服务器市场年复合增长率将达到46.8%,2029年市场规模将达到162亿美元。
从2024年数据来看,浪潮信息、超聚变和宁畅占据了液冷服务器市场七成左右的销售份额,传统服务器厂商正依托其硬件设计经验与全链条方案加速融入AI服务器协同场景。
2025年开放计算技术大会上,浪潮信息发布面向万亿参数大模型的“元脑SD200”,可运行1.2万亿参数的Kimi K2,并支持DeepSeek、Qwen、Kimi、GLM等多模型并行,目前已投入商用。
不过,浪潮信息的该款超节点产品采用了电互联和风冷技术,并未采用新兴的光互联与液冷技术,公司也表示在未来面向更高密度部署时将推进高压直流供电、液冷散热等方案。
03
硬件加码与生态竞争
国产AI芯片与服务器厂商纷纷拥抱超节点的同时,一个典型特征是集体作战。
据《科创板日报》报道,燧原科技云燧ESL超节点系统正在测试中,单节点最高64卡全带宽互联,采用液冷方案,可实现9216GB单节点存储容量、230TB/s单节点存储带宽、51.2TB/s单节点聚合带宽、单节点可支持PD分离优化。
沐曦集成则在WAIC大会上发布旗舰GPU曦云C600,首发训推一体技术全栈方案,该芯片可支持MetaXLink超节点扩展技术。
与之共同冲刺科创板的摩尔线程首次提出AI工厂理念,其自研KUAE计算集群通过5D大规模分布式并行计算技术,可实现上千节点的高效协作。
此外,超节点竞争不仅拼硬件性能,也拼生态。
尤其是在CUDA生态差距之下,本土芯片企业正通过合纵连横与开放生态加速追赶。
面对大模型的底层应用,阶跃星辰联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。
其中,无问芯穹与模速空间、华为昇腾开启百亿生态共建合作,华为昇腾910B加速卡已上线模速空间算力生态平台,无穹AI云总算力规模超25000P。
与此同时,壁仞科技联合创始人、CTO洪洲强调了一个现实,即兼容CUDA生态也很重要,而且不会妨碍创新,但不要把GPGPU和DSA对立起来,英伟达新的智算GPU也在不断增加低比特精度矩阵运算,动态量化和数据搬运DSAs。
作为AI芯片企业中身段、战略相对灵活的一家,壁仞除了关注芯片架构创新之外,尤其关注软硬结合的系统级优化,这对其打造万卡集群解决方案,实现了超大规模算力的高效利用具有重要作用。
此外,浪潮信息的元脑SD200也基于OCM(开放算力模组)与OAM(开放加速模块)两大架构打造,在开放架构下支持多样化芯片、开放AI框架及主流开发工具,实现跨平台兼容与扩展。
从硬件兼容到软件适配,生态完善度对超节点方案的最终竞争力起着至关重要的作用。
04
尾声
超节点架构的兴起正在重塑整个AI算力产业链,从芯片制造、先进封装到光互连技术、液冷散热,再到系统集成与解决方案,每个环节都需要有企业顶上。
这一新技术的兴起也标志着AI算力竞争从单芯片性能比拼进入系统级能力较量阶段,既提高了竞争门槛,又创造了新的价值分配模式。
当前,华为、壁仞、浪潮信息、曦智、无问芯穹等企业已率先起跑,但超节点之战才刚刚开始。
相关文章
这些年来,虽然苹果Pro系列强势崛起,销量远超标准版,比如今年16国内销量700万台、Pro系列销量2700万台,看起来感觉标准版好像快要掉链子了,但...
2025-09-17 0
【摘要】一场由大模型引爆的算力革命,正从单芯片的物理极限走向超节点的系统级创新,AI基础设施的竞争法则迎来新一轮重构。从华为的全对等互联、壁仞科技的光...
2025-09-17 0
来源:中天科技官微日前,工业和信息化部公示了《2025年5g工厂名录》,中天科技集团旗下五家公司(江苏中天科技股份有限公司、江东科技有限公司、中天科技...
2025-09-17 0
9月12日,第十二批30位在韩中国人民志愿军烈士遗骸及相关遗物由中国空军运-20专机接运回国。运-20专机降落沈阳桃仙国际机场后,机场以“过水门”最高...
2025-09-17 0
AMD 的 RDNA4 架构一出,不少玩家心里直犯嘀咕:不拼性能巅峰,改主打能效比,难道是性能拼不过才找的借口?但仔细看下来,这更像是 AMD 一次精...
2025-09-17 0
8月29日上午10点,一辆标有“九识智能”的无人物流车从中通快递昆山吴淞江网点大门缓缓驶出,在确认直行车道可通行后,便快速左拐驶入机动车道,向着既定路...
2025-09-17 0
这篇文章把自媒体平台的算法底裤一把扯下:先用“低粉高能”筛选器锁定 3 小时内的爆款基因,再对标题与开头做像素级拆解,最后用“三合一重组术”把别人的流...
2025-09-17 0
9月13日8时许,在西安航空基地(蓝田)机场,飞行教练张子帆和学员吕林登上一架运动类固定翼飞机。飞机在跑道上加速,很快腾空而起,飞向蓝天。大约1个小时...
2025-09-17 0
发表评论