补齐拼图后,高通终于猛推“三端归一”

当地时间10月20日下午,记者抵达美国夏威夷茂宜岛,参加10月21日开启的高通骁龙峰会。在峰会的前两个主题日,高通在智能手机和汽车平台拿出了三款骁龙Elite(至尊版)新品。其中最引人关注的,莫过于高通自研CPU架构Oryon的“开枝散叶”。在去年首次应用于高通AI PC芯片骁龙X Elite之后,Oryon CPU走进了此次发布的一款手机芯片平台和两款汽车芯片平台。加上高通自研的Adreno GPU和Hexagon NPU,高通补齐了自研SoC的最后一块拼图,也统一了PC、手机、汽车三条产品线的芯片架构。

完成四年前的规划 第二代Oryon CPU亮相

本次骁龙峰会上,高通公司总裁兼CEO克里斯蒂亚诺·安蒙(Cristiano Amon)没有参与三款新品的发布,但他花了相当的篇幅发布贯穿三款新品的主线:第二代Oryon CPU。

安蒙用一张图总结一年来高通在Oryon CPU上的成果

Oryon CPU的研发,可以追溯到2021年高通斥资14亿美元收购CPU设计企业Nuvia。虽然Nuvia当时仅仅创立两年,创始团队却拥有在苹果、谷歌等企业担任芯片架构师的经验,在公司成立一年后就推出了自研CPU架构“Phoenix”,以更低功耗实现了显著高于竞品的峰值性能。

在2021年3月完成收购后,安蒙就表示高通计划将下一代 CPU 集成到智能手机、PC、数字驾驶舱、ADAS系统等产品线。而这一愿景,在之后三年的骁龙峰会上,一步一步走进现实。

在2022年骁龙峰会,高通公布了下一代名为“Oryon”的CPU核心设计,但并未展现具体细节。在2023年骁龙峰会,Oryon CPU正式亮相,采用12个3.8GHz高性能核心,单核性能跑分领先竞品的同时,达到竞品峰值性能所需的功耗减少30%~70%,率先搭载于同期发布的新款PC芯片骁龙X Elite。

本次骁龙峰会发布的第二代Oryon CPU,性能相比第一代提升了30%,同等性能下功耗降低了57%。在单核、多核以及达到相同峰值性能所需的功耗等参数领先竞品的同时,Oryon CPU在设备不插电的情况下,性能不会衰减。这一特点使Oryon CPU在不插电模式下,处理速度比竞品CPU快134%,也使骁龙X Elite在不插电模式下相比竞品处理器快90%。同时,由于第二代Oryon CPU将首次搭载到手机平台,因此相比竞品,Oryon CPU能够将性能和能效的提升兑现在更小的封装中。

在生成式AI的浪潮袭来之后,围绕算力的竞争更加白热化,头部处理器厂商都不约而同地缩短了产品发布周期,从过去的2年一迭代走向1年一迭代。高通对于Oryon CPU似乎也有此打算。安蒙表示,对于下一代Oryon CPU,他已经看到了一些高通工程团队所作的工作并为此感到振奋,请关注明年骁龙峰会的发布。

面向手机、汽车芯片要求 进一步定制

自研CPU架构的利好,就是能够根据不同产品线的需求,对CPU进行微架构层面的调优和定制。“我们从头开始打造IP,Oryon CPU正是我们自研SoC的最后一块拼图。这种方式让我们拥有对CPU的完全自主权,能够直接定义和定制所有处理通道的配置,不再依赖外部(第三方)。”高通技术公司产品管理总监Manju Varma表示。

由于第二代Oryon CPU从PC平台走进手机平台,因此高通CPU设计团队首先面向移动平台进行架构调整。高通工程副总裁、Oryon CPU设计负责人Gerard Williams(曾为Nuvia创始人)在回顾团队这一年的工作时表示,他们大幅提升了Oryon CPU的时钟速度,同时降低功耗,这是推动Oryon CPU走进移动终端的核心驱动力。同时,为了适应移动设备更小型的体积和电池,团队也在降低减少芯片面积上下了功夫。

具体来看,骁龙8至尊版搭载的Oryon CPU采用了面向移动端设计的全新微架构。在核心设计上采用了2颗超级内核+6颗性能核心,不再采用能效核。超级内核引入全新的数据时序预取器,基于模式检测预取所有缓存行(CPU缓存存储数据的基本单位),并预测特定使用情况下哪些缓存行会被使用,以实现更高的频率(4.32GH)和性能,并提升在紧凑产品外形设计下的能效表现。6个性能核都经过调优,在保证能效的前提下运行密集型的应用程序。

对于不再使用能效核,高通的解释是,用乱序性能内核取代能效核,能够提供更好的性能和功耗组合,并配合超级内核实现更高的处理速度。

高通技术公司产品管理总监Manju Varma介绍骁龙8至尊版CPU设计

内存同样是提升CPU处理速度的关键。高通为每个CPU丛集配置了24MB专用缓存。通常,增加一级缓存或二级缓存都会导致时延的增加。因此,高通在提升一级缓存容量的同时,采用缓存一致性协议,将时延保持在1纳秒内。同时,为了解决二级缓存扩容造成的时延,高通设计了与CPU内核同步的二级缓存,以降低时延和功耗。考虑到生成式AI高度依赖内存,骁龙8至尊版配备了目前最高速的LPDDR5内存。这样的微架构和内存系统升级,能够为用户带来更快的应用启动速度、更流畅的多任务处理以及生成式AI功能。

而骁龙座舱和RIDE至尊版使用的Oryon CPU,围绕车用平台进行了三方面的提升。一是处理能力较前一代车规平台的CPU提升了三倍。二是强化了安全功能。三是面向汽车应用设计的适应性架构,能够支持先进舱驾功能和自动驾驶功能,也能够在同一块SoC上同时支持舱、驾功能,这无疑契合了当前舱驾一体的融合趋势。

“在汽车平台,Oryon CPU的定制化聚焦安全系数,以确保汽车在智能驾驶等场景下的安全性,让GPU、NPU、DSP等IP模块在安全的基础上运行。”高通技术公司汽车、行业解决方案和云事业群总经理Nakul Duggal向记者表示。

当然,相比芯片平台本身,手机、PC和汽车厂商能够结合最新芯片能力设计出哪些功能,或许是消费者更为关注的点,而这需要高通与OEM及终端、车企继续加深合作,并通过高通AI Hub等模型库,为广大应用开发者提供更加趁手的工具和平台。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )