作者:王聪彬AI的想象力正在无限扩张,但要把它落地为真实体验,却不仅是模型突破那么简单,还意味着硬件与软件体系的重构。随着加速芯片解决方案层出不穷,性...
2025-09-17 0
作者:王聪彬
AI的想象力正在无限扩张,但要把它落地为真实体验,却不仅是模型突破那么简单,还意味着硬件与软件体系的重构。随着加速芯片解决方案层出不穷,性能上限不断被刷新,但也带来前所未有的复杂性、更繁重的系统集成以及成本的持续攀升,工程团队与商业模式都面临巨大的压力。
这些变量汇聚在一起,塑造了Arm计算平台的演进方向。
“人工智能正以前所未有的速度推动计算技术的演进。”Arm高级副总裁兼终端事业部总经理Chris Bergey说道。无论是模型、框架,还是应用场景,几乎以“每周变化”的节奏快速发展,这意味着计算能力不仅需要不断扩展,还必须保持足够的灵活性,才能跟上创新的步伐。
在这种快速迭代的背景下,算力的竞争已经不再只是单点性能的比拼,而是平台化、体系化的持续进化。Arm选择在架构层面重新定义计算底座,用灵活、可扩展的方式回应AI的不确定性与爆发力。
Arm高级副总裁兼终端事业部总经理Chris Bergey
打开移动设备AI创新的全新入口
Arm Unlocked 2025 AI峰会上海站上,Arm 推出了全新Lumex计算子系统 (Compute Subsystem, CSS) 平台,该平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能Arm CPU、GPU及系统IP。助力生态伙伴更快将AI设备推向市场,同时支持桌面级移动游戏、实时翻译、智能助手及个性化应用等多样的丰富体验。
Arm Lumex CSS平台聚焦移动设备领域,致力于为从旗舰智能手机到平板电脑等移动设备,提供顶级CPU与GPU性能,成为支撑下一代AI与个人计算发展的核心底座。
Lumex CSS是完整的“AI优先”平台,标志着Arm的平台战略和Armv9计算架构的又一次进化。从Armv8到搭载SVE2的Armv9架构,Arm始终将“可扩展性”作为推动AI在各类设备广泛应用的关键。如今,搭载SME2的Armv9.3架构在AI计算领域实现了又一次重要突破。
CPU方面,全新的Arm C1-Ultra是迄今性能最强的CPU产品,与上一代 Arm Cortex-X925 CPU相比,为设备带来高达25%的单线程峰值性能提升,能够轻松应对最严苛的AI与计算负载。针对功耗敏感场景,经过能效优化的Arm C1-Pro在同等性能下较 Cortex-A725带来多达 12%的能效提升,为轻量化与长续航应用提供了理想选择。
GPU方面,Mali G1-Ultra在性能和能效之间实现了平衡,推理性能最高提升20%的同时,每帧功耗降低 9%,为新一代移动设备带来更流畅的图形与AI体验。
目前搭载Arm GPU的芯片出货量已突破120亿颗,Arm不仅深度参与移动图形领域,更持续引领行业前行。全新Mali G1-Ultra通过先进光线追踪技术,将桌面级游戏体验带到移动端,重新定义智能手机图形处理标准。
本次 Lumex CSS 的最大亮点在于,Arm 为全线 C1 CPU 集成了 SME2 技术,该技术可有效提升端侧 AI 功能运行速度。对于 Arm 合作伙伴和开发者生态系统而言,相较于未启用 SME2 特性的硬件,这些提升能显著加速不同工作负载和用例中的 AI 性能。在Whisper Base上语音识别延迟降低4.7倍,在Google Gemma 3模型上进行经典大语言模型的聊天交互时,AI性能提升4.7倍,在Stability AI Stable Audio模型上生成音频,速度提升2.8倍。对于开发者和终端用户而言,这些改进不仅是数据上的提升,更意味着全新的交互方式与体验边界正在被重塑。
此外,Arm Lumex CSS平台通过KleidiAI与各大主流框架的集成,包括PyTorch ExecuTorch、Google LiteRT、阿里巴巴MNN及微软ONNX Runtime,开发者无需修改任何代码,即可自动取得 SME2的加速能力。
Arm Lumex CSS平台,为扩展而生,为AI时代而设计,是驱动未来移动创新的全新起点。Chris Bergey强调,无论是OEM厂商,还是应用开发者,Arm Lumex CSS平台都将成为在关键边缘场景中交付个性化、私密化、高性能AI的核心工具。
将创新前沿落地到用户体验中
在智能终端与移动计算的演进进程中,Arm一直是不可或缺的技术引擎。随着全新Arm Lumex CSS平台及其与SME2技术的原生集成,产业链上下游正在以前所未有的深度联动,将前沿创新落地到用户体验中。
在vivo高级副总裁、首席技术官施玉坚看来,智能手机产业的每一次跃迁,都离不开Arm 在微架构与计算技术方面的持续突破。作为首个与Arm共建联合实验室的终端品牌,vivo不仅与芯片平台厂商协作,在手机中率先落地Arm的先进计算技术,更将真实用户场景引入微架构优化,实现从底层特性到最终体验的全链路打磨。
在SME2的探索上,vivo从2023年起便着手研究其在多类AI任务中的适用路径,并在自研的VCAP计算加速平台上全面支持SME2指令集。在全局离线翻译等场景中,SME2的引入让性能突破过往最优上限,实现额外20%性能收益。
Arm最新一代的高性能计算技术以及SME2等先进特性,将在即将发布的全新X系列旗舰产品上得到完整呈现。
如果说vivo的探索体现了从硬件底层到终端体验的打磨,那么支付宝的实践,则显示了 SME2在超大规模应用中的价值。作为日均执行超过100亿次推理任务的超级应用,支付宝的端侧AI引擎xNN正快速拓展生成式模型与代理模型的推理能力。在与Arm的合作中,KleidiAI与SME2技术被集成进xNN,显著优化了推理效率和功耗表现。
同时,支付宝团队也在研发低比特量化策略,借助KleidiAI的灵活性,定制出适合自身业务需求的量化方案,进一步压缩模型规模、提升部署效率。
在Arm、vivo与支付宝三方联合推动下,基于SME2的大语言模型推理在预填充阶段性能提升超过40%,在解码阶段提升超过25%。这不仅标志着CPU后端能力的跃升,更意味着运行大模型的设备覆盖范围被大幅拓展,让更多用户能够直接在终端享受到生成式AI的实时、私密与低成本体验。
支付宝终端技术负责人翁欣旦相信,随着xNN的持续演进,以及与SME2的深度融合,支付宝有望在更多场景进一步发挥AI的潜能,构建更智能、更安全、更个性化的服务生态。
无论是vivo将SME2融入手机底层架构优化,还是支付宝借助SME2扩展端侧大模型推理能力,两者都展现了Arm生态的协同力量:以硬件为底座、以场景为驱动,在移动计算与 AI的交汇点不断突破边界。随着Arm Lumex CSS平台与SME2的普及,产业链合力正在加速推动智能手机和超级应用进入一个全新的AI原生时代。
相关文章
作者:王聪彬AI的想象力正在无限扩张,但要把它落地为真实体验,却不仅是模型突破那么简单,还意味着硬件与软件体系的重构。随着加速芯片解决方案层出不穷,性...
2025-09-17 0
AI技术浪潮的持续性,核心在于“算力”这一基石。从大模型训练到硬件迭代,每个环节的数据都揭示:这不是短暂热潮,而是深度的产业升级。本文基于行业数据,解...
2025-09-17 0
IT之家 9 月 17 日消息,科技媒体 Wccftech 昨日(9 月 16 日)发布博文,报道称 AMD 为打破英伟达 CUDA 在 AI 领域的...
2025-09-17 0
年初至今,行业结构分化较为显著,涨幅靠前的行业中,通信、电子行业涨幅都超过了50%,成为绝对的行情主线,但如果不小心重仓了红利、消费,可能今年的收益要...
2025-09-17 0
昨天,2025苏州人工智能+产业创新大会暨云智算技术生态大会上,中国移动的表现可谓相当亮眼!会上,中国移动重磅发布多项先进科技加持的移动云超级智能助手...
2025-09-17 0
在普通人看来,当明星是最赚钱的行业,否则也不会有人拼了命也要混进娱乐圈。不过,在资本面前,再红的明星也得点头哈腰。因为资本才是带动娱乐圈发展的根本原因...
2025-09-17 7
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-09-17 7
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-09-17 3
发表评论