【CNMO科技消息】据海外科技媒体最新报道,三星A57已在GeekBench上现身,显示其将搭载三星自研的新一代Exynos处理器。此次在GeekBe...
2025-08-10 0
内存墙摇摇欲坠,一场由架构创新驱动的算力革命正冲破HBM垄断的阴影。
两天后,华为将在“2025金融AI推理应用落地与发展论坛”上发布一项AI推理领域的突破性技术。这项创新通过架构设计与存储技术融合,直指中国AI产业的痛点——高端AI服务器对HBM的依赖度高达90%以上,而全球HBM产能被SK海力士、三星等海外巨头垄断,国产替代率不足5%。
这项技术若成功落地,将彻底改变中国AI算力受制于人的困境,推动金融、政务等敏感场景的AI应用加速落地,并可能重塑全球AI芯片竞争格局。
01 破局时刻:HBM垄断困境与华为的破局之道
当前AI算力竞赛的核心资源HBM,已成为中国AI产业发展的关键瓶颈。全球HBM产能几乎被海外巨头垄断,国产替代率不足5%。这种依赖不仅推高成本,更让中国在金融、医疗、工业等关键领域的AI落地举步维艰。
华为此次技术突破的核心在于“硬件重构+软件智能”的深度协同。通过超节点级联构建“超级AI服务器”,结合纳秒级通信网络和智能调度系统,实现算力、运力、存力的全维度优化。
华为云此前发布的CloudMatrix384昇腾AI云服务已验证类似技术路径:单卡Decode吞吐突破1920 Tokens/s,KV Cache传输带宽提升10倍,输出每个Token的时延降至50ms。
华为在内存优化领域已有深厚积累。其EMS弹性内存存储服务通过显存与DRAM池化,实现“显存扩展”“算力卸载”“以存代算”三大功能。该技术使盘古大模型5.0的NPU部署数量降低50%,推理首Token时延降低80%。
这些创新为即将发布的技术突破奠定了坚实基础,也为中国AI产业开辟了一条绕开HBM限制的新路径。
02 国产力量:云天励飞等厂商的推理芯片突围
就在华为布局突破性技术的同时,中国AI芯片企业也在加速构建自主推理算力体系。云天励飞战略锚定推理芯片,成为这场国产替代浪潮的重要力量。
2025年7月,云天励飞董事长陈宁博士荣获“年度AI人物”,其团队打造的“算力积木”架构正在引领AI推理芯片国产化浪潮。公司最新推出的DeepEdge10系列芯片采用国产先进工艺Chiplet工艺,实现了四个“首个”突破:
- 首个D2D Chiplet商用设计
- 首个C2C Mesh MoE推理架构
- 首个128T算力商用平台
- 首个集成国产大核RISC-V的AI芯片
DeepEdge10系列覆盖8T—256T算力范围,支持7B、14B、130B、671B等不同参数量大模型的推理。该芯片平台已成功适配DeepSeek R1系列模型、QwQ-32B模型及国产鸿蒙操作系统。
云天励飞的经营数据印证了市场对国产推理芯片的强劲需求:2024年营收增长81%,2025年一季度增速提升至160%。随着AI推理算法迭代和算力需求攀升,这一增长势头有望延续。
02 市场爆发:推理芯片需求增长的黄金时代
AI产业正经历历史性转折——从训练时代迈入推理时代。云天励飞董事长陈宁指出,2025年将成为人工智能发展的重要转折点:大模型技术已经成熟,模型调用成本显著降低,推理算力需求将迎来爆发式增长。
数据印证了这一趋势:中国AI推理芯片市场规模从2020年的113亿元,跃升至2024年的1626亿元,年复合增长率近95%。预计2024年至2030年,将以53.4%的年复合增长率增长,到2029年将突破万亿元。
三大增量正在推动推理算力需求加速:
- 互联网大厂加速AI与传统业务融合
- Agent与深度思考推理结合
- 多模态技术加速渗透
字节跳动豆包大模型的数据印证了这种趋势:2025年5月其日均Tokens消耗量达16.4万亿,相比去年同期增长137倍。更多tokens消耗反哺云端推理算力需求,形成增长闭环。
推理芯片的爆发源于AI正全面重塑电子产品形态。从智能耳机、智能眼镜到扫地机器人、冰箱,再到电动汽车,几乎所有电子设备都将被重新定义。这些设备需要像人类一样交流、理解复杂指令并解决实际问题,都离不开AI推理芯片的底层支撑。
03 生态布局:华为CANN开源与概念股阵营
华为在构建AI生态方面的战略布局同样值得关注。2025年8月7日,华为宣布全面开源其昇腾芯片软件生态系统CANN。这一举措在AI算力领域投下了一颗战略棋子。
CANN作为昇腾AI芯片与高层AI训练框架之间的桥梁,允许开发者在无需处理芯片级复杂性的情况下充分利用昇腾算力。与英伟达闭源的CUDA不同,华为选择了开放的道路,旨在联合行业力量构建繁荣的芯片生态系统。
华为的CANN开源生态已经吸引了一批上市公司深度参与:
- 润和软件(300339):作为华为鸿蒙生态核心合作伙伴,深度参与AI智能体技术研发
- 神州数码(000034):华为核心合作伙伴,涉及昇腾产品分销及云服务
- 拓维信息(002261):华为“昇腾智造”合作伙伴,参与AI算力平台建设
- 科大讯飞(002230):与华为合作实现MoE模型推理吞吐提升3.2倍,端到端时延降低50%
金融行业将成为华为技术落地的首站。华为在该领域的AI布局已形成成熟体系:分布式新核心方案5.5支撑了超75%的大行和股份制银行核心转型。智能体技术则推动风控、审计等复杂场景从单点智能向多体智能跃迁。
04 资本布局:AI推理产业链的投资机遇
资本市场对国产AI推理技术的突破反应敏锐。海光信息2025年第二季度业绩亮眼:单季营收30.64亿元,同比增长41.15%;研发投入7.92亿元,同比增长42.2%。
海光正在筹划换股吸收合并中科曙光,推动芯片设计与整机制造的垂直整合,构建从芯片到算力服务的全栈能力。这一战略举措将巩固其在国产算力基础设施中的关键地位。
国家网信办就H20算力芯片漏洞后门安全风险约谈英伟达公司,并启动调查。这一事件或将加快国产算力芯片替代进程,为国内AI芯片企业创造历史性机遇。
华为AI超级智能体生态链企业也在加速布局:
- 金财互联(002530):与华为合作财税大模型,开发智能员工
- 酷特智能(300840):联合华为打造智能体集群
- 三联虹普(300384):与华为发布全国首个化纤工业智能体解决方案
这些企业正从端、边、云全方位构建国产AI推理生态,推动中国AI产业实现从“依赖进口”到“自主创新”的战略转型。
这场由华为引领的技术突破,其影响远超金融领域。当推理芯片不再被HBM束缚,中国大模型产业将获得前所未有的自由——从云端数据中心到边缘智能终端,从工业产线到家用电器,AI推理能力将如电流般渗透至每个角落。
云天励飞的“算力积木”架构与华为的存算融合技术共同描绘出国产AI芯片的未来图景:通过Chiplet技术,多个计算单元可像积木般灵活组合;借助超节点级联,算力资源得以跨设备高效流动。这些底层创新使千亿参数大模型能在边缘设备流畅运行,让智能体在50毫秒内作出响应。
全球算力版图正在重构。当海外巨头仍围绕HBM产能展开军备竞赛时,中国科技企业选择了一条更艰难却更具想象力的道路——用架构创新替代硬件堆砌,用开放生态对抗技术封锁。这场突围不仅关乎市场份额,更将决定下一代AI基础设施的话语权归属。
个人观点:华为在AI推理领域的技术突破以及国内相关企业的协同发展,确实为中国AI产业摆脱海外技术垄断带来了曙光。从市场需求来看,推理芯片市场的爆发式增长已是明确趋势,这为相关产业链企业提供了广阔的发展空间。不过,技术落地的实际效果、生态构建的完善程度以及市场竞争的不确定性等因素仍需持续关注。投资者在看待相关投资机会时,应保持理性,充分研究企业的核心竞争力和发展潜力,谨慎决策。据此投资责任自负。
相关文章
【CNMO科技消息】据海外科技媒体最新报道,三星A57已在GeekBench上现身,显示其将搭载三星自研的新一代Exynos处理器。此次在GeekBe...
2025-08-10 0
本篇文章给大家谈谈和你解答逍遥棋牌怎么开挂,以及对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 如何评价腾讯、盛大、网易、完美等游戏公司? 1...
2025-08-10 0
内存墙摇摇欲坠,一场由架构创新驱动的算力革命正冲破HBM垄断的阴影。两天后,华为将在“2025金融AI推理应用落地与发展论坛”上发布一项AI推理领域的...
2025-08-10 0
近年来,随着外卖行业的蓬勃发展,"外卖超时"问题逐渐成为消费者、骑手、商家与平台多方博弈的焦点。尤其是在点餐高峰期或恶劣天气条件下,外卖超时现象尤为严...
2025-08-10 0
金融界2025年8月9日消息,国家知识产权局信息显示,徐州鸿丰高分子材料有限公司申请一项名为“一种化工物料研磨机”的专利,公开号CN120438085...
2025-08-10 0
8月9日中午,在世界机器人大会上,针对资本市场上市,宇树科技创始人、CEO王兴兴接受记者采访时透露,目前宇树科技正在推进中规中矩的上市流程。“我们公司...
2025-08-10 3
日前,包钢股份成功中标某钢轨联合采购项目,将为国家重点工程提供关键物资支撑。这标志着包钢股份在高端铁路用钢领域竞争力持续巩固,有力助推国家重大铁路工程...
2025-08-10 1
青岛日报社/观海新闻8月4日讯 在官路水库施工现场,随着安全员一声哨响,吊车挥舞长臂,将一块重达170公斤的预制混凝土联锁块,稳稳放在大坝内侧的斜坡上...
2025-08-10 2
发表评论