当前位置: CompoTech China > 业界资讯 >
 

Arm 全新 Lumex CSS 平台实现两位数性能提升,驱动消费电子设备“更智能、更高效、更个性化”

本文作者:Arm       点击: 2025-09-10 13:54
前言:
 
Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称 Arm)今日宣布推出全新 Arm® Lumex™ 计算子系统 (Compute Subsystem, CSS) 平台,这是一套专为旗舰级智能手机及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能 Arm CPU、GPU 及系统 IP,不仅能助力生态伙伴更快将 AI 设备推向市场,还可支持桌面级移动游戏、实时翻译、智能助手及个性化应用等多样的丰富体验。
 

Arm 高级副总裁兼终端事业部总经理 Chris Bergey 表示:“AI 已不再仅仅是一项技术功能,它已成为下一代移动与消费技术的支撑底座。依托 Arm Lumex 平台,我们持续提升端侧 AI 体验,以满足用户日益增长的需求与期待。为此,我们正积极将 SME2 技术扩展至每一个 CPU 平台。预计到 2030 年,SME 与 SME2 技术将为超过 30 亿台设备新增超 100 亿TOPS 的计算能力,为端侧 AI 性能带来指数级跃升。”

合作伙伴可灵活选择使用 Arm Lumex 的方式,为其打造系统级芯片 (SoCs)。例如,他们可直接采用 Arm 交付的平台,并借助为其需求定制的先进物理实现方案,从而获得缩短产品上市时间和快速兑现性能价值等双重优势;或者,合作伙伴也可根据他们的目标市场,对平台寄存器传输级 (RTL) 设计进行配置,并自行完成核心模块的硬化工作。

全新 Arm Lumex 平台包含以下核心组件:

新一代搭载 SME2 技术的 Armv9.3 CPU 集群:包括 Arm C1-Ultra 和 Arm C1-Pro,为旗舰设备提供支持
Arm C1-Premium:专为次旗舰市场打造,可提供一流的面积效率
Arm Mali™ G1-Ultra GPU:配备新一代光线追踪技术,在实现先进的图形和游戏体验同时,还可提升整体 AI 性能
Arm C1-DSU:Arm 迄今为止最灵活、高能效且具多种电源模式的 DynamIQ Shared Unit (DSU)
针对三纳米工艺节点优化的物理实现
跨软件栈的深度集成,为使用 KleidiAI 软件库的开发者提供无缝的 AI 加速体验

搭载 SME2 技术的 CPU:助力实现全场景 AI 加速

搭载 SME2 的 Arm C1 CPU 集群,为实际场景中的 AI 驱动型任务带来了显著的 AI 性能提升,包括:

AI 性能提升高达五倍
语音类工作负载延迟降低 4.7 倍
音频生成速度提升 2.8  倍

全新的 Arm CPU 在 AI 计算能力上的飞跃,让实时的端侧 AI 推理成为现实,为用户在音频生成、计算机视觉及情境助手等多种交互场景中带来更流畅、更快速的体验。

在实际场景中,SME2 技术将响应速度与运行效率提升至全新水平。例如,在“智能瑜伽教练”演示应用中,得益于 SME2 技术,该应用的文本转语音生成速度提升了 2.4 倍,这意味着用户能即时获得姿势反馈与指导,且全程不用担心设备的电池续航问题。此外,通过 Arm、支付宝与 vivo 的三方合作下,将大语言模型 (LLM) 的交互响应时间缩短了多达 40%,充分证明了 SME2 可为终端设备带来更快速的实时生成式 AI 体验。

SME2 技术的价值不仅在于速度的提升,更在于释放出传统 CPU 无法企及的 AI 驱动功能。例如,在搭载 SME2 的单个核心上运行神经摄像头降噪功能,可以在 1080P 分辨率下实现帧率超 120 帧/秒 (fps),或在 4K 分辨率下实现帧率达 30fps。这使得智能手机用户即使身处光线最暗的场景,也能捕捉到更锐利、清晰的图像,进而在日常设备上获得更流畅的操作交互与更丰富的使用体验。

不同于受到延迟、成本及隐私问题等挑战的云优先 AI,Lumex 将智能引入设备端,能够在本地实现更快、更安全且随时可用的智能体验。SME2 已经广受业界领先生态伙伴的采用,包括阿里巴巴、支付宝、三星 System LSI、腾讯及 vivo。

为全线产品层级赋予架构自由

Arm Lumex 为合作伙伴提供了充分的自由度,使其能从高端智能手机、PC 到新兴 AI 优先设备的各类产品中,实现峰值性能、持续能效与芯片面积之间的灵活平衡。

CPU

主要优势

性能与能效提升

理想应用场景

Arm C1-Ultra

旗舰级峰值性能

单线程性能提升 25%IPC 性能同比实现两位数增长

大模型推理、计算摄影、内容创作、生成 AI

Arm C1-Premium

兼具 C1-Ultra 性能且面积效率更优

相较于 C1-Ultra 面积缩减 35%

次旗舰移动设备市场、语音助手、多任务处理

Arm C1-Pro

持久高能效

持续性能提升 16%

视频播放、流式推理

Arm C1-Nano

极致能效

效率提升 26%,面积更小

可穿戴设备、超小型设备


 
 
 
 
 
 
 
 
 
 
 
 
Mali GPU:实现桌面级游戏体验和更快的 AI 推理
 

随着搭载 Arm GPU 的芯片累计出货量突破 120 亿颗,Arm 持续稳居手游体验领域的核心地位。全新的 Arm Mali G1-Ultra GPU 进一步突破移动游戏的性能边界,为手游玩家带来高保真、主机级画质。这一突破得益于全新的第二代光线追踪 (Ray Tracing Unit v2, RTUv2) 技术,该技术显著提升光照、阴影与反射效果,使其光线追踪性能相较前代提升了两倍。在 AI 工作负载方面,Mali G1-Ultra 可将推理性能提升最高 20%,显著增强各类实时应用的响应速度。

在各类图形基准测试中,Mali G1-Ultra 较前代产品实现了 20% 的性能提升,为《暗区突围:无限》、《堡垒之夜》、《原神》、《崩坏:星穹铁道》等主流游戏带来了全面的性能增强。同时,Mali G1-Premium 与 Mali G1-Pro 两款 GPU,也为硬件资源受限的设备提供了更出色的性能与能效表现。

开发者友好的端侧 AI 解决方案
 

开发者可在 Arm Lumex 平台上获取开机即用的 AI 开发体验。通过 KleidiAI 与各大主流框架的集成,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN 及微软 ONNX Runtime,开发者无需修改任何代码,即可自动取得 SME2 的加速能力。

对于需要构建跨平台应用的开发者而言,Lumex 带来了全新的可迁移性:
Gmail、YouTube 和 Google Photos 等 Google 应用现已全面支持 SME2 ,搭载 Lumex 的设备一经上市即可无缝运行
跨平台可迁移性意味着针对安卓构建的优化功能可无缝扩展至采用 Arm 架构的 Windows 及其他操作系统
支付宝等合作伙伴已成功验证:依托 SME2 技术,终端设备上的大语言模型 (LLM) 可实现高效运行。

Apple、三星和 MediaTek 等科技领军企业,正积极集成 AI 加速功能,推动端侧 AI 向更快速、更高效的方向发展。其中,Apple 正凭借该能力为“苹果智能” (Apple Intelligence) 提供核心支撑;三星与 MediaTek 则借助 Google Gemini 提升翻译、摘要、个人助手等实时 AI 应用的响应速度与运行效率。

Arm Lumex:AI 时代的平台级智能

Arm Lumex 不仅是 Arm 面向消费计算市场的最先进 CSS 平台,更是开启新时代智能 AI 体验的基石。无论是 OEM 厂商还是开发者,Lumex 均可提供所需工具,助力其在关键端侧场景实现兼具个性化、隐私保障与高性能的 AI 体验。作为专为 AI 时代打造平台, Arm Lumex 将成为未来移动创新的全新起点。
 
合作伙伴证言:

“通过与 SME2 的深度集成,MNN 现已能在智能手机端,为通义千问等十亿参数级的大模型提供低延迟的量化推理能力。这一成果充分体现了 Arm 与阿里巴巴在共同推动下一代可扩展移动 AI 技术发展中的创新实力。”
阿里巴巴淘天集团业务技术 MNN 负责人 姜霄棠

“在 Arm、支付宝与 vivo 的三方密切协作下,支付宝已在 vivo 新一代旗舰智能手机上完成了基于 Arm SME2 技术的大语言模型推理验证。结果显示,在预填充 (prefill) 与解码 (decode) 阶段,性能分别实现了超过 40% 和 25% 的提升。这标志着 CPU 后端能力的重大突破。我们对迄今为止所取得的成果倍感鼓舞。我们相信,随着 xNN 的持续演进,以及与 SME2 的深度融合,支付宝有望在更多场景进一步发挥 AI的 潜能,构建更智能、更安全、更个性化的服务生态。”
支付宝终端技术负责人 翁欣旦

“得益于 SME2 技术增强的硬件,像 Gemma 3 这样更先进的 AI 模型能够直接在各类设备上运行。随着 SME2 的持续扩展,移动开发者将能在整个生态系统中无缝部署新一代 AI 功能,最终让终端用户在他们智能手机上随时享受低延迟的 AI 体验。”
Google 安卓平台杰出软件工程师 Iliyan Malchev 

“AI 正在重塑我们与设备、与周围世界的互动方式,而 Arm 生态系统正推动该领域的关键技术突破。在 Meta,我们对 Arm Kleidi 与 PyTorch 框架下 ExecuTorch 工具的集成感到兴奋,这一集成将让我们的应用得以在下一代技术平台上无缝运行,进而为终端用户带来体验的显著加速。”
Meta 人工智能合作部总监 Sy Choudhury

“在三星,我们很高兴能继续与 Arm 合作,基于 Arm Lumex CSS 平台开发下一代旗舰移动产品。这一合作使我们能够持续突破端侧 AI 的边界,为用户带来更智能、更迅捷、更高效的体验。”
三星电子副总裁兼 SOC IP 开发团队负责人 Nak Hee Seong

“SME2 技术通过突破关键性能瓶颈,高效助力大语言模型在移动端落地部署,如腾讯混元大模型,为端侧大语言模型提供强劲加速,最终带来更优质的用户体验。”
腾讯机器学习平台专家 杨晓峰
 
关于 Arm

Arm 作为业界性能最强、能效最高的计算平台,以无可比拟的规模,覆盖全球 100% 的联网人群。Arm 提供先进的解决方案以满足对计算永无止尽的需求,进而赋能全球领先的科技公司释放前所未有的人工智能体验和性能。Arm 携手全球最广泛的计算生态系统和 2,200 万软件开发者,共同在 Arm 平台上构建人工智能的未来。

所有信息都「依目前情况」提供,且并不带保证或代表性。此一文件可以自由分享,但不得修改且必须注明出处。Arm 是 Arm Limited (或其子公司) 的商标或注册商标。所有其他品牌或产品名称乃为所属个别公司之财产。© 1995-2025 Arm Limited