首页 景点排名文章正文

当架构为AI而生,Arm Lumex CSS成为移动计算新基石

景点排名 2025年09月17日 20:04 0 admin

作者:王聪彬

AI的想象力正在无限扩张,但要把它落地为真实体验,却不仅是模型突破那么简单,还意味着硬件与软件体系的重构。随着加速芯片解决方案层出不穷,性能上限不断被刷新,但也带来前所未有的复杂性、更繁重的系统集成以及成本的持续攀升,工程团队与商业模式都面临巨大的压力。

这些变量汇聚在一起,塑造了Arm计算平台的演进方向。

“人工智能正以前所未有的速度推动计算技术的演进。”Arm高级副总裁兼终端事业部总经理Chris Bergey说道。无论是模型、框架,还是应用场景,几乎以“每周变化”的节奏快速发展,这意味着计算能力不仅需要不断扩展,还必须保持足够的灵活性,才能跟上创新的步伐。

在这种快速迭代的背景下,算力的竞争已经不再只是单点性能的比拼,而是平台化、体系化的持续进化。Arm选择在架构层面重新定义计算底座,用灵活、可扩展的方式回应AI的不确定性与爆发力。

当架构为AI而生,Arm Lumex CSS成为移动计算新基石

Arm高级副总裁兼终端事业部总经理Chris Bergey

打开移动设备AI创新的全新入口

Arm Unlocked 2025 AI峰会上海站上,Arm 推出了全新Lumex计算子系统 (Compute Subsystem, CSS) 平台,该平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能Arm CPU、GPU及系统IP。助力生态伙伴更快将AI设备推向市场,同时支持桌面级移动游戏、实时翻译、智能助手及个性化应用等多样的丰富体验。

Arm Lumex CSS平台聚焦移动设备领域,致力于为从旗舰智能手机到平板电脑等移动设备,提供顶级CPU与GPU性能,成为支撑下一代AI与个人计算发展的核心底座。

Lumex CSS是完整的“AI优先”平台,标志着Arm的平台战略和Armv9计算架构的又一次进化。从Armv8到搭载SVE2的Armv9架构,Arm始终将“可扩展性”作为推动AI在各类设备广泛应用的关键。如今,搭载SME2的Armv9.3架构在AI计算领域实现了又一次重要突破。

CPU方面,全新的Arm C1-Ultra是迄今性能最强的CPU产品,与上一代 Arm Cortex-X925 CPU相比,为设备带来高达25%的单线程峰值性能提升,能够轻松应对最严苛的AI与计算负载。针对功耗敏感场景,经过能效优化的Arm C1-Pro在同等性能下较 Cortex-A725带来多达 12%的能效提升,为轻量化与长续航应用提供了理想选择。

GPU方面,Mali G1-Ultra在性能和能效之间实现了平衡,推理性能最高提升20%的同时,每帧功耗降低 9%,为新一代移动设备带来更流畅的图形与AI体验。

当架构为AI而生,Arm Lumex CSS成为移动计算新基石

目前搭载Arm GPU的芯片出货量已突破120亿颗,Arm不仅深度参与移动图形领域,更持续引领行业前行。全新Mali G1-Ultra通过先进光线追踪技术,将桌面级游戏体验带到移动端,重新定义智能手机图形处理标准。

本次 Lumex CSS 的最大亮点在于,Arm 为全线 C1 CPU 集成了 SME2 技术,该技术可有效提升端侧 AI 功能运行速度。对于 Arm 合作伙伴和开发者生态系统而言,相较于未启用 SME2 特性的硬件,这些提升能显著加速不同工作负载和用例中的 AI 性能。在Whisper Base上语音识别延迟降低4.7倍,在Google Gemma 3模型上进行经典大语言模型的聊天交互时,AI性能提升4.7倍,在Stability AI Stable Audio模型上生成音频,速度提升2.8倍。对于开发者和终端用户而言,这些改进不仅是数据上的提升,更意味着全新的交互方式与体验边界正在被重塑。

此外,Arm Lumex CSS平台通过KleidiAI与各大主流框架的集成,包括PyTorch ExecuTorch、Google LiteRT、阿里巴巴MNN及微软ONNX Runtime,开发者无需修改任何代码,即可自动取得 SME2的加速能力。

Arm Lumex CSS平台,为扩展而生,为AI时代而设计,是驱动未来移动创新的全新起点。Chris Bergey强调,无论是OEM厂商,还是应用开发者,Arm Lumex CSS平台都将成为在关键边缘场景中交付个性化、私密化、高性能AI的核心工具。

将创新前沿落地到用户体验中

在智能终端与移动计算的演进进程中,Arm一直是不可或缺的技术引擎。随着全新Arm Lumex CSS平台及其与SME2技术的原生集成,产业链上下游正在以前所未有的深度联动,将前沿创新落地到用户体验中。

在vivo高级副总裁、首席技术官施玉坚看来,智能手机产业的每一次跃迁,都离不开Arm 在微架构与计算技术方面的持续突破。作为首个与Arm共建联合实验室的终端品牌,vivo不仅与芯片平台厂商协作,在手机中率先落地Arm的先进计算技术,更将真实用户场景引入微架构优化,实现从底层特性到最终体验的全链路打磨。

在SME2的探索上,vivo从2023年起便着手研究其在多类AI任务中的适用路径,并在自研的VCAP计算加速平台上全面支持SME2指令集。在全局离线翻译等场景中,SME2的引入让性能突破过往最优上限,实现额外20%性能收益。

Arm最新一代的高性能计算技术以及SME2等先进特性,将在即将发布的全新X系列旗舰产品上得到完整呈现。

如果说vivo的探索体现了从硬件底层到终端体验的打磨,那么支付宝的实践,则显示了 SME2在超大规模应用中的价值。作为日均执行超过100亿次推理任务的超级应用,支付宝的端侧AI引擎xNN正快速拓展生成式模型与代理模型的推理能力。在与Arm的合作中,KleidiAI与SME2技术被集成进xNN,显著优化了推理效率和功耗表现。

同时,支付宝团队也在研发低比特量化策略,借助KleidiAI的灵活性,定制出适合自身业务需求的量化方案,进一步压缩模型规模、提升部署效率。

在Arm、vivo与支付宝三方联合推动下,基于SME2的大语言模型推理在预填充阶段性能提升超过40%,在解码阶段提升超过25%。这不仅标志着CPU后端能力的跃升,更意味着运行大模型的设备覆盖范围被大幅拓展,让更多用户能够直接在终端享受到生成式AI的实时、私密与低成本体验。

支付宝终端技术负责人翁欣旦相信,随着xNN的持续演进,以及与SME2的深度融合,支付宝有望在更多场景进一步发挥AI的潜能,构建更智能、更安全、更个性化的服务生态。

无论是vivo将SME2融入手机底层架构优化,还是支付宝借助SME2扩展端侧大模型推理能力,两者都展现了Arm生态的协同力量:以硬件为底座、以场景为驱动,在移动计算与 AI的交汇点不断突破边界。随着Arm Lumex CSS平台与SME2的普及,产业链合力正在加速推动智能手机和超级应用进入一个全新的AI原生时代。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap