超节点洗牌AI算力格局，壁仞、浪潮信息、无问芯穹等掀起智算革命

AI科技 2025年09月17日 11:25 0 admin

【摘要】一场由大模型引爆的算力革命，正从单芯片的物理极限走向超节点的系统级创新，AI基础设施的竞争法则迎来新一轮重构。

从华为的全对等互联、壁仞科技的光互连突破，到浪潮信息的“元脑”商用部署，再到无问芯穹的生态共建，一场由硬件到软件、由单点突破到系统协同的智算革命，正在全面加速。

以下为正文：

超节点兴起

近年来，DeepSeek-R1、Qwen3、MiniMax-VL-01、GLM 4.5等开源模型频繁涌现，各厂商开启大模型竞赛，算力需求走向新高，AI基础正面临前所未有的挑战。

麦肯锡研究报告预测，到2030年，全球数据中心投资规模或达6.7万亿美元，其中5.2万亿美元将用于支持人工智能算力需求，推动数据中心总装机容量增至219GW。

与此同时，单芯片的显存与带宽愈发难以支撑万亿参数大模型，大模型推理的实时性要求又与多卡互联长链路的延迟性产生冲突，由此，超节点架构成为应对性能瓶颈、响应市场需求的关键。

当前，超节点技术可突破单服务器限制，并通过NVLink/UB等高速互联技术，将GPU间通信时延压缩至百纳秒级，极大提升资源调度效率。

在2025世界人工智能大会上，华为、中兴、新华三、超聚变等中国企业纷纷推出智算超节点方案。

其中，华为昇腾384超节点（Atlas 900 A3 SuperPoD）是这一架构的典型代表，其集成了384个昇腾 910C 神经网络处理单元(NPU)和192个鲲鹏920中央处理器(CPU)，采用华为自研的MatrixLink高速互联技术，实现全对等互联。

根据官方数据，在昇腾超节点集群上，LLaMA 3等千亿稠密模型性能相比传统集群提升2.5倍以上，在通信占比更高的Qwen、DeepSeek等多模态、MoE模型上，可以达到3倍以上的提升。

2025年，超节点已成为智算中心的核心架构，从互联网巨头到电信运营商，从创业公司到芯片龙头，无不在这场变革中重新寻找自己的位置。

从传输到散热

技术实现角度，想要扩大超节点规模，首先需要增加机柜与服务器连接数量。

而与传统的铜缆相比，光缆具有远距离传输优势，可实现数据交付与机柜解耦与万卡级弹性拓展，兼容现有机房设施降低部署成本，并按算力需求动态调整超节点规模，实现分阶段建设。

基于此，业内头部公司正在合作解决这一问题。

今年7月，曦智科技、壁仞科技、中兴通讯联合推出光跃LightSphere X，成为全球首个分布式光互连光交换GPU超节点解决方案，并获得2025 WAIC SAIL大奖。

据悉，该超节点基于曦智科技全球首创的分布式光交换技术，采用硅光技术的光互连光交换芯片，搭配壁仞科技自主原创架构的大算力通用GPU液冷模组与全新载板，并搭载中兴通讯高性能AI国产服务器及仪电智算云平台软件。

目前，曦智科技已与国内领先的光/电晶圆厂、光/电封装厂、算力/交换芯片厂商、系统厂商等建立起全方位、多层次的战略合作关系。

通过产业链上下游的深度协同与联合技术攻关，公司在超节点建设、CPO等关键领域实现多项突破。这一紧密协作的体系不仅显著提升了产品兼容性与系统效能，也实现了从核心器件到算力基础设施的全链路协同优化，也为构建高效、开放、安全的新一代算力生态奠定了坚实基础。

整个系统中，壁仞科技承担关键的动力引擎角色，其产品不是普通的显卡GPU，而是用于AI训练、高性能计算等领域的超级计算芯片，计算能力非常强大，加上业内伙伴的加持，计算单元性能效率极高，特别适用于需要处理海量数据的场景。光跃LightSphere X方案也即将于上海仪电智算中心落地，计划实现数千卡规模商业化部署。

此前壁仞科技相关负责人透露，从光直连技术到光互连光交换OCS GPU超节点，这已经是壁仞和曦智两家合作实现的第三代产品。据悉，壁仞在第一代产品上便已实现真正意义上的超节点。

针对包含Deepseek的大模型训练与推理需求，该方案可显著缩短训练时间、提升算力利用率并降低算力成本。与此同时，作为上海的标杆项目，该方案将有效推动上海本地光芯片、液冷技术、GPU模组等产业的协同发展，迅速形成“技术-产品-服务”的闭环生态。

此外，光交换芯片的低功耗特性及液冷技术的应用，能够助力数据中心绿色转型，也符合国家“双碳”目标。

这一案例也可看出，超节点的散热正逐渐从传统风冷走向液冷。

IDC数据显示，中国液冷服务器市场在2024年市场规模达到23.7亿美元，同比增长67.0%，预计2024-2029年，中国液冷服务器市场年复合增长率将达到46.8%，2029年市场规模将达到162亿美元。

从2024年数据来看，浪潮信息、超聚变和宁畅占据了液冷服务器市场七成左右的销售份额，传统服务器厂商正依托其硬件设计经验与全链条方案加速融入AI服务器协同场景。

2025年开放计算技术大会上，浪潮信息发布面向万亿参数大模型的“元脑SD200”，可运行1.2万亿参数的Kimi K2，并支持DeepSeek、Qwen、Kimi、GLM等多模型并行，目前已投入商用。

不过，浪潮信息的该款超节点产品采用了电互联和风冷技术，并未采用新兴的光互联与液冷技术，公司也表示在未来面向更高密度部署时将推进高压直流供电、液冷散热等方案。

硬件加码与生态竞争

国产AI芯片与服务器厂商纷纷拥抱超节点的同时，一个典型特征是集体作战。

据《科创板日报》报道，燧原科技云燧ESL超节点系统正在测试中，单节点最高64卡全带宽互联，采用液冷方案，可实现9216GB单节点存储容量、230TB/s单节点存储带宽、51.2TB/s单节点聚合带宽、单节点可支持PD分离优化。

沐曦集成则在WAIC大会上发布旗舰GPU曦云C600，首发训推一体技术全栈方案，该芯片可支持MetaXLink超节点扩展技术。

与之共同冲刺科创板的摩尔线程首次提出AI工厂理念，其自研KUAE计算集群通过5D大规模分布式并行计算技术，可实现上千节点的高效协作。

此外，超节点竞争不仅拼硬件性能，也拼生态。

尤其是在CUDA生态差距之下，本土芯片企业正通过合纵连横与开放生态加速追赶。

面对大模型的底层应用，阶跃星辰联合近10家芯片及基础设施厂商，共同发起“模芯生态创新联盟”，首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。

其中，无问芯穹与模速空间、华为昇腾开启百亿生态共建合作，华为昇腾910B加速卡已上线模速空间算力生态平台，无穹AI云总算力规模超25000P。

与此同时，壁仞科技联合创始人、CTO洪洲强调了一个现实，即兼容CUDA生态也很重要，而且不会妨碍创新，但不要把GPGPU和DSA对立起来，英伟达新的智算GPU也在不断增加低比特精度矩阵运算，动态量化和数据搬运DSAs。

作为AI芯片企业中身段、战略相对灵活的一家，壁仞除了关注芯片架构创新之外，尤其关注软硬结合的系统级优化，这对其打造万卡集群解决方案，实现了超大规模算力的高效利用具有重要作用。

此外，浪潮信息的元脑SD200也基于OCM（开放算力模组）与OAM（开放加速模块）两大架构打造，在开放架构下支持多样化芯片、开放AI框架及主流开发工具，实现跨平台兼容与扩展。

从硬件兼容到软件适配，生态完善度对超节点方案的最终竞争力起着至关重要的作用。

尾声

超节点架构的兴起正在重塑整个AI算力产业链，从芯片制造、先进封装到光互连技术、液冷散热，再到系统集成与解决方案，每个环节都需要有企业顶上。

这一新技术的兴起也标志着AI算力竞争从单芯片性能比拼进入系统级能力较量阶段，既提高了竞争门槛，又创造了新的价值分配模式。

当前，华为、壁仞、浪潮信息、曦智、无问芯穹等企业已率先起跑，但超节点之战才刚刚开始。

人形机器人电池成新增长极

实测辅助“乐乐麻将有挂吗”（详细透视教程）-哔哩哔哩

发表评论

超节点洗牌AI算力格局，壁仞、浪潮信息、无问芯穹等掀起智算革命

人形机器人电池成新增长极

实测辅助“乐乐麻将有挂吗”（详细透视教程）-哔哩哔哩

热门文章

最新文章