作者:张国斌
5月26日的发布堪称是 Arm新品发布上里程碑式的发布,因为它开启了一个新的时代!
“过去的 12 个月着实令人难以置信,整个世界正转向基于Arm 架构的计算,并正在利用 Arm 移动生态系统的规模优势 我们看到了场景定义的计算和专用的处理能力为用户带来了一种可能,他们可以完全根据自己的意愿、时间和地点使用设备,且其性能、电池寿命和安全性丝毫不受影响,这将使设计人员能够自由地进行设备形态的创新、并开创新市场,我们称之为 “数字赋能”,并相信这将激发出世界的潜能。”在5月26日的Arm Total Compute 媒体沟通会上,Arm 终端设备事业部的总经理 Paul Williamson指出,“消费性电子设备计算的下一步就是全面计算,它基于三个关键原则:设备的性能、性能的可及性、设备的安全性。今天我要介绍Arm第一款面向终端市场的全面计算解决方案---全面计算解决方案到底包括什么呢?全面计算解决方案是一套包含 IP 、软件与工具的完整套件,能针对不同的市场应用,打造出最佳 的 SoC 这次推出的技术产品都是基于 Armv9 架构开发的, 它为未来十年的场景定义的计算设备奠定了基础,这些解决方案本身也都包括一些新功能。”
他进一步指出当我们谈论 "全面计算 "方法时,它是指我们共同优化智能手机中计算系统的不同元素,使它们尽可能有效地在给定的功率范围内提供最佳性能。最重要的是通过提供一个单一的工具链、简单的API以及能够看到如何使用这些工具的能力,使开发者能够从这个整体的角度来处理新的用例。
“衡量计算的方式以及将计算应用于解决问题和创造体验的方式,正在发生变化。过去,我们可能会以CPU基准和原始性能来衡量一个设备的水平,而现在,智能手机等设备已经非常依赖图形处理器(GPU)或神经处理单元(NPU)驱动的人工智能的增强,”他指出,“当你看到今天的智能手机时,其外观和感觉与2007年的第一批设备基本相同。改变的是可以实现的体验,从类似游戏机的游戏到预订乘车服务。这其中许多体验源于开发者的创新,这就是为什么为他们配备所需的性能、工具和洞察力是如此重要。”
他强调,全面计算能够更好地帮助Arm的合作伙伴去应对目前正在显著增加的用于所有终端市场上的SoC的复杂性。对于合作伙伴而言,他们希望能够将新品更快速地推向市场。而全面计算解决方案包含了SoC设计流程中所需要的一切组件——硬件 IP、软件、物理IP、工具和标准,将使Arm的合作伙伴在开发基于全面计算解决方案的新SoC时受益,让他们能够满怀信心地通过最新的技术,将高性能的产品快速推向市场。
Arm 全新的全面计算解决方案--基于V9架构的CPU
据介绍,Arm 全新的全面计算解决方案采用系统范围的整体优化方法,横跨硬件 IP、物理 IP、软件、工具和标准,为 Arm 的合作伙伴提供更为广泛的选择,满足所有终端细分市场的应用场景和成本区间。
全面计算解决方案也将解锁整个生态系统的新体验,例如,专为移动设备设计、支持 AI 功能的交互式应用场景,可以使用户身临其境观看电视中丰富的 8K 内容。所有的这一切再加上安全技术作为基础,将为未来十年构建可信的数字化服务。
这些解决方案的核心是 Arm 的全新 IP 套件,包括首批 Armv9 Cortex™ CPU、具有出色图形功能的Mali™ GPU 和全新的 CoreLink™ 系统 IP。
最新发布的Arm Cortex-X2 是 Arm 目前性能最强大的 CPU,相较于当前旗舰型安卓智能手机,它的性能高出 30%。除了峰值性能外,Cortex-X2 还可在旗舰智能手机和笔记本电脑之间扩展,使 Arm 的合作伙伴可以根据市场需求来设计基于不同场景的计算能力。
最新发布的Arm Cortex-A710 是首款基于 Armv9 架构的大核 CPU,与 Cortex-A78 相比,能效提升 30% ,性能提升 10%。通过这些性能和效率的提升,当智能手机运行高要求的app时,用户将获得比以往更长的使用时间以及更优化的用户体验。
最新发布的Arm Cortex-A510 是 Arm 过去四年来推出的首款高效率小核,其性能提升 35%,机器学习性能提升超过三倍。它所带来的性能水平已经接近几年前推出的上一代大核,适用于智能手机、家用设备和可穿戴设备。
“Cortex-X2是完完全全面向智能手机市场的产品,我们预计在未来几代的手机产品中就能看到Cortex-X2的身影。对智能手机和其他终端计算设备而言,64位将提供终极的性能表现。所以,Arm目前正与中国应用商店生态合作伙伴进行密切协作,确保主要app都能在今年年底前支持 64 位,从而为中国消费者提供Cortex-X2所带来的最佳性能提升体验。”他强调,“目前我们正持续与中国的手机应用商店合作伙伴密切携手,来分阶段实现向64位过渡,目前,Cortex-X2、Cortex-A510已经是64位CPU,目前A710仍然支持32位,未来,我们预计到2023年,Arm在移动应用的大核跟小核都将仅支持64位。”
而Armv9-A CPU 群集(cluster)的支柱是新款的动态共享单元( DynamIQ Shared Unit)DSU-110,该组件可为不同的细分市场提供各种解决方案。DSU-110 具备可扩展性、可支持多达八个 Cortex-X2 内核配置的出色性能、安全性和机器学习功能,同时还能确保效率表现。
Arm 全新的全面计算解决方案--基于V9架构的GPU
“2020 年有超过十亿个 Mali GPU 出货到市场上,这是连续第五年 Mali 的年出货量超过十亿,Mali GPU 成为世界最受欢迎的 GPU,它正驱动着关键市场的技术发展与创新 它提供了最佳的手游、新的 AI 技术和应用程序的体验,同时强化了家庭娱乐与增强现实技术应用, Mali GPU 驱动着 80% 的电视、超过半数的智能手机。”他指出。
据介绍,新款 Arm Mali-G710 是针对旗舰智能手机和不断增长的 Chromebook 笔记本市场所推出的高性能 GPU,在计算密集型体验方面(如 AAA 高保真游戏)的性能提升 20%。对于各种与机器学习有关的任务(如全新相机和视频模式的图像增强),Mali-G710 也带来了 35% 的机器学习性能提升。
与去年类似,Arm 推出 Arm Mali-G610 ,作为次旗舰 GPU。该 GPU 继承了 Mali-G710 的所有功能,但价格更低,促使合作伙伴能够快速应对这个不断增长的市场,并将高阶应用场景带给更多的开发者和消费者。
Arm Mali-G510 实现了性能和效率的完美平衡,在中端智能手机、旗舰智能电视和机顶盒上,实现了 100%的性能提升以及22%的节能优化 ,从而延长了电池续航时间,提升了 100% 的机器学习性能。
Arm Mali-G310 是 Arm 最高效的 GPU,以最小的面积成本提供了最高的性能。通过 Mali-G310, Valhall 架构和高质量图形技术将被引入到更低成本的设备中,例如入门级智能手机、AR 设备和可穿戴设备。
全面计算解决方案如何提升性能?
“当你把这些结合在一起,你便得到我们首款全面计算解决方案。如你所见,我们已经适配好 IP、 优化其表现,使之得以在任何设备上提供最佳的用户体验,从终极性能的笔记本,直至最低功耗 的可穿戴设备 你即将在任一设备中获取更优异的用户体验,而且还有最新 Armv9 架构的安全功能作为支撑Arm 的互连技术对于提高系统性能至关重要。”他指出。
而最新的 CoreLink CI-700 一致性互连技术和 CoreLink NI-700片上网络互连技术与 Arm CPU、GPU 和 NPU IP 无缝搭配,可跨 SoC 解决方案增强系统性能。CoreLink CI-700 和 CoreLink NI-700 对新的 Armv9-A 功能提供硬件级支持,如内存标签扩展(Memory Tagging Extension),并支持更高的安全性、改进的带宽和延迟。
Williamson指出此次新发布的IP是基于最新的Armv9架构,为了更好地表明Armv9架构为市场带来的改变,所以在命名上采用了三位数规则。
他一再强调Armv9带来的主要功能是为了更好地落实我们全面计算设计战略的三大关键原则。第一个原则是安全性,在安全方面Arm引入了一些新的安全技术,比如说MTE——内存标签扩展,还有指针验证(pointer authentication, PA)。同时,在机器学习方面我们支持BFloat16格式,从而更好地去支撑Int8计算和BFloat16 的机器学习。此外,对于SVE2的引入,也就是可伸缩矢量扩展能力方面的提升,能够更好地帮助开发者对高阶的应用场景进行开发,比如图像信号处理。
“全面计算解决方案很好地整合了我们所有处理器所具备的强大 AI 功能,在这里你可以看到一些亮点,在不同的 Arm IP 上运行多样的 AI 工作负载所带来的巨大性能提升,这些性能提升各异,从 Mali-G710 平均 35% 的提升,到 Cortex-M55 的高达 700% 的提升 ,Arm 解决方案提供了最广泛的 AI 引擎,使得开发者能在他们任意选择的应用上部署 AI 功能 。”他指出。“对Arm来说,这是非常令人兴奋的一次发布。这次不仅是Arm历年来最大阵容的产品发布,而且这些产品都是基于Armv9架构,同时我们也为大家介绍了全面计算解决方案。Arm全面计算解决方案旨在针对不同的应用场景提供最优的解决方案,实现最快的速度,打造更卓越的用户体验。”
注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利!