ARM十年磨一剑,v9新架构会重构CPU市场吗?

科技云报道原创。

近日,ARM正式宣布推出ARMv9架构。据ARM官方称,这是10年来最重要的创新,是未来3000亿ARM芯片的基础。

与上一代的ARMv8相比,ARMv9处理器将不再局限于移动/嵌入式市场,而是扩展到PC、HPC高性能计算、深度学习等新市场,以满足全球对功能日益强大的安全、人工智能和专用处理的需求。

ARMv9架构的发布,会对CPU市场带来什么样的影响?对于中国而言,是否能够解“缺芯”之急呢?

ARMv9的三大亮点

2011年10月,ARM首次发布ARMv8架构,十年后的今天,ARMv9立足于ARMv8的成功基础,将成为担纲未来十年的主流计算架构。那么,它和ARMv8架构相比有哪些不同呢?

据ARM高级副总裁、首席架构师兼技术院士Richard Grisenthwaite介绍,ARMv9继续使用AArch64作为基准指令集,但是在其功能上增加了一些非常重要的扩展。

他指出ARMv9有三个主要支柱,即:安全性、AI(机器学习)以及改进的矢量和DSP功能。

亮点一:安全

为了解决当今最大的技术挑战——保护全球数据安全,ARMv9架构路线图引入了ARM机密计算架构(Confidential Compute Architecture, CCA)。

机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。

例如,在ARM TrustZone的基础上,可以将个人银行信息与智能手机的社交媒体应用完全分离。ARM CCA的新安全功能意味着,即使社交媒体应用真的感染了恶意软件,也不会传播设备其他部分。

ARM CCA还引入动态创建机密领域(Realms的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。

例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。在云中,这也意味着保护物理CPU以及运行在第三方代码旁边的虚拟化处理器。

此外,ARM持续与谷歌合作开发的内存标签扩展(MTE)技术,将成为第一代基于ARMv9-A处理器的一个组成部分。

过去30年中,许多广为人知的数据安全漏洞,都是利用计算机如何存储和调用内存中的数据的漏洞造成的。如果黑客知道一串重要数据的位置,他们就可以用恶意代码覆盖它。

MTE使开发人员能够使用“标签”锁定数据串。然后,只有使用正确的密钥才能访问该数据,该密钥由“指针”(负责从内存中调用数据的代码)持有。实现锁和密钥访问是一个巨大的步骤,不仅可以确保数据的安全,而且还可以保证数据的安全。

亮点二:针对AI机器学习的优化

机器学习是ARMv9的重要组成部分,ARM认为在未来几年中,越来越多的机器学习工作负载将变得司空见惯。

为了满足这一需求,ARM与富士通合作开发了可伸缩矢量扩展(Scalable Vector Extension, SVE)技术,并驱动了世界上最快的超级计算机“富岳”。在此基础上,ARM为ARMv9开发了SVE2,以便在更广泛的应用中实现增强的机器学习和数字信号处理能力。

除了增加的各种现代SIMD功能外,SVE和SVE2的优势还在于其可变的向量大小,范围覆盖了128b到2048b,让其无论在什么硬件运行,都允许向量的可变粒度为128b。

如果纯粹从向量处理和编程的角度来看,这意味着软件开发人员将只需要编译一次其代码,并且如果将来某个CPU带有本地的512b SIMD execution pipelines,该代码将能够充分利用单元的整个宽度。

同样,相同的代码将能够在具有较低硬件执行宽度能力的保守设计上运行,这对于ARM设计从物联网、移动到数据中心的CPU而言至关重要。在保留ARM体系结构的32b编码空间的同时,它还可以完成所有这些工作。然而,类似X86这样的架构,则需要根据矢量尺寸增加新的指令和扩展。

SVE2增强了对在CPU上本地运行的5G系统、虚拟和增强现实以及机器学习工作负载的处理能力,如:图像处理和智能家居应用。

未来几年,ARM将进一步扩展其技术的AI能力,除了在其Mali GPU和Ethos NPU中持续进行AI创新外,还将大幅增强CPU内的矩阵乘法。

亮点三:通过系统设计实现性能最大化

在过去的五年,ARM技术每年都以超过业界的速度提升CPU性能。ARM在新一代架构ARMv9上将保持这个速度,预计未来两代移动和基础设施CPU的性能提升将超过30%。

据ARM官方称,这个数据是根据业界标准评测工具来衡量,30%的算力提升完全是凭借于本身架构,而不是借助于制程工艺来实现的。

然而,随着行业从通用计算向普遍的专用处理发展,每年两位数的CPU性能提升是不够的。除了增强专用处理能力,ARM的全面计算(Total Compute设计方法,将通过集中的系统级硬件和软件优化以及用例性能的提高,加速总体计算性能。

通过将全面计算的设计原则应用在包含汽车、客户端、基础设施和物联网解决方案的整个IP组合中,ARMv9系统级技术将遍及整个IP解决方案,并改善个别IP。

此外,ARM还在开发多项技术以提高频率、带宽、缓存,并降低内存延迟,从而最大限度地提升基于ARMv9的CPU性能。

ARM欲打破x86垄断

目前,CPU领域最成功的架构当属x86,不过x86的成功和统治力在于PC和高性能计算市场,在ARM擅长的智能终端市场并不成功。

近几年,ARM架构在高性能计算领域取得了一些进展,包括上面提到的“富岳”超级计算机,以及推出采用ARM架构的多款服务器。

去年,苹果基于ARM架构推出M1处理器,并成功应用在Macbook Pro电脑上。此外,高通、微软也在布局基于ARM架构的电脑处理器和系统。这一系列的举动,都让业界看到了x86架构在PC市场的统治地位并非牢不可破。

ARM首席执行官Simon Segars说,“ARM芯片实现1000亿颗的出货花了26年,如果预测准确,接下来一年,我们的合作伙伴出货的ARM芯片将累计达到2000亿颗。也就是说,我们的第二个1000亿的出货将在短短5年内达成。”

据媒体报道,目前ARM架构的芯片出货已经超过1800亿颗,ARMv9架构会成为实现ARM芯片3000亿颗芯片出货的先驱。

没有人能准确预估ARM实现第三个1000亿颗芯片出货的时间,但可以明确的是,ARM希望其芯片能够为所有智能计算提供算力,也就是让其芯片在未来无处不在。

现在看来,在复杂的国际形势下,同属精简指令集的RISC-V正在快速发展,加上x86阵营Intel和AMD也在加强x86的竞争力,ARM要真正撼动x86的优势领域并非易事。

华为能否获得ARMv9授权?

不过,相比于ARMv9到底更新了哪些功能,国内关注更多的还是华为能否获得ARMv9的授权。

据悉,华为自主研发的海思芯片就是基于ARM架构设计的。在美国出台芯片禁令之时,华为方面表示,已经获得了ARMv8架构授权,可以自主设计处理器,并掌握到核心技术。

虽然华为掌握着ARMv8架构,但没有最新构架的支持,华为也将陷入停滞不前的状态。

对于ARMv9是否以供给包括华为在内的中国企业的问题,ARM的官方回复是:

“ARM既有源于美国的IP,也有非源于美国的IP。经过全面的审查,ARM确定其ARMv9架构不受美国出口管理条例(EAR)的约束。ARM已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。”

细品这番发言,ARM的态度实在是模棱两可:

ARM官方没有说任何关于ARMv9可以授权给华为的事情。

第二,从ARM官网上可以看到,谷歌、英伟达、高通、小米、OPPO、VIVO、联发科、台积电都是ARM的合作伙伴,但是华为却不见踪影,可见这件事背后,还是有一些隐情。

换句话说,华为能否得到ARMv9的授权,其实还是一个未知数。

另一方面,即使华为得到v9的授权,但芯片制造依然是一个大问题。

同时,国内业界也在担忧,在ARM新架构之下,快速进军PC和服务器业务,这会对我国硬件国产化以及系统国产化带来更大压力。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2021-04-14
ARM十年磨一剑,v9新架构会重构CPU市场吗?
ARM十年磨一剑,v9新架构会重构CPU市场吗?

长按扫码 阅读全文