正如约翰·齐曼(J.Ziman)所言:“不同规模、不同层次的各种技术形成相互共生、寄生与竞争的生态关系,使得任何技术的生存与发展不是孤立的事件”。芯片架构的革命也随着IC业浪潮的演进“合成”向前,从32位到64位,从单核到多核,从同构到异构,每一次架构革命都让芯片产生质的飞跃。而在智能互联的AIoT时代,异构计算芯片成为当仁不让的主角。
毕竟,在经历了“数字化、互联网化、移动互联网化”的洗礼之后,“人工智能化”时代的海量计算需求、算法迭代让传统的通用CPU“难堪重任”,应运而生的异构计算芯片“晋级”成为支撑先进和更复杂AIoT应用的必然选择。作为一种将不同指令集和架构的计算单元(如传统的CPU、GPU、DSP还有创新的TPU、DLA等)融合在一起、实现高效协同运行的计算技术,业界有人认为,将传统架构的芯片比作汽油引擎的话,那么异构计算芯片就是混合动力甚至新能源引擎。
整装待发
不论是什么样的技术路线图,都必须在关键时间节点上更新。而这一“引擎”的“横空出世”其实是市场与技术相互碰撞的结果。
异构计算的显著优势在于实现了性能、成本和功耗均衡的技术,同时也是让最适合的专用硬件去做最适合的事如密集计算或外设管理等,从而达到性能和成本的最优化。这样“各成其就”的异构芯片,理所当然自带光芒。
英特尔中国研究院院长宋继强在上周的英特尔媒体分享会上表示,异构计算不是一个新词,其实上世纪80年代就有了,即超过一种以上的硬件架构设计组合。而这种组合有两种形式,比如将CPU、GPU、FPGA等组成一个一体化设计的SoC,将达到最高的能效比,但需要量大面广,才值得投入;另一种是这些独立的芯片通过板级连接实现异构计算,其优势在于灵活,但板与板之间连接的功耗、带宽都大打折扣。
与之相呼应的是,近几年来不仅众多IP厂商在加强异构芯片IP研发,主流芯片厂商也均加大新一代异构芯片的出新频率,异构芯片开始大行其道,或将迎来新的爆发期。有预计说,在高性能计算、人工智能等应用领域,异构计算芯片市场规模将突破千亿美元。
这一风向标对产业带来的影响或是全方位的,一方面众多芯片厂商加强横向扩展,运用资本力量大肆整合全面出击,构筑异构芯片领域的护城河;另一方面,异构阵营泾渭分明,各大厂商合纵连横,同时一些新生力量亦角逐其中,有望改写产业未来格局。
软硬件挑战
异构计算虽不是全新的概念,但最早的异构融合还基于CPU和GPU,而真正崛起要从2001年用GPU实现通用矩阵计算开始。而且,其“外延”已延伸至CPU、DSP、GPU、ASIC、FPGA等各种计算单元、使用不同类型指令集、不同体系架构的“整合”,让各种核心有效地协同合作。
显然,这激起了“连锁”反应,由于设计难度大、生态系统需重构等挑战,在过去很长一段时间仍处在不断演进当中。毕竟从编程方式、软硬件架构到生态系统,异构计算仍面临着诸多挑战。
其硬件实现就不简单。首先,不同芯片之间的互联布线,要求性能高、速度快,同时功耗要低。其次,要通过混搭方式,将不同种类的、不同技术的芯片封装在一起,支持互联,保持高带宽和高频率,分外复杂。最后,选择大批量生产的工艺,快速验证等等,决定了在硬件上从选择用什么样的基底,到用什么材料实现互联,都需通盘和全面考量。
为了让异构计算发挥最大性能优势,还需要对硬件设计特定的算法以及软件优化,才能够最大化硬件能力,即软硬结合。做到真正的软硬结合,软件环境的优化亦是重中之重,如何打造完善的软硬件体系,让“众选手”各展所长、协同合作,并进而提供良好的生态体系,来支撑异构计算体系的全面应用亦是一大挑战。
可以说,无论是总线及接口、编程工具、存储管理、应用软件技术等,在诸如异构多核架构指令集、微架构、工具链设计等环节仍需投入大量资金和时间。
三大阵营的心机
显然作为新AI时代的“利器”,异构计算将重塑产业格局,各方势力各藏心机,激烈角逐。
目前,全球异构计算领域呈现三足鼎立的态势,分别是以AMD、高通、ARM、三星、北京华夏芯等为主体的全球异构计算系统HSA联盟,以IBM、Google、英伟达为主体的OpenPOWER联盟和英特尔最新提出的超异构计算愿景。
这三大体系均在全力推进:HSA联盟强调生态共建,资源共享,主推OpenCL的异构编程框架。自从2012年成立以来,围绕异构计算发展中最迫切需要解决的编程语言、技术标准、知识产权等问题已经做了大量卓有成效的工作,包括发布了新一代异构计算技术规范、搭建开放的异构计算平台、推出了一系列专用工具和较为完善的面向人工智能的开发环境等等。
而AMD 3A平台、ARM Coretex处理器和Mali图形核心、Imagination PowerVR图形核心、德州仪器OMAP处理器平台等都将成为HSA基金会的基石。
而OpenPower联盟利用Power8等芯片在高性能计算领域的技术优势和IBM产品的应用生态基础,在高性能计算领域占有优势。自2013年IBM在联合Google、NVIDIA、TYAN、Mellanox成立以来,目前已有数百位成员,中国成员除了浪潮、新云东方等硬件供应商外,也有腾讯、阿里、网易这样的互联网巨头。据悉在OpenPower 研发平台上,已有10万+应用,以及10万+经过行业认证的产品,包括软件、服务管理和解决方案。特别是其基于CAPI总线的全新加速器解决方案,使Power服务器完全支持CAPI+FPGA,开启了第二代异构计算。
虽然英特尔在以一已之力对抗,但在英特尔转型制定了“以数据为中心”的发展战略之后,一切创新与变革都以此为轴心。而在AI时代风起云涌之际,“全武行”的英特尔也祭出了“超异构计算”的旗帜,在异构计算技术路径发展方面已然自成一派。
超异构计算的“超”
超异构计算的横空出世,缘于英特尔对数据洪流引发的变革,有了更加“系统”的思考,认为在智能联所带来的数据洪流推动下,为应对未来数据的多样化、数据量的爆发式增长以及处理方式的多样性,单纯发展先进工艺或封装或架构改善已不足以满足未来多元化的计算需求。
以AI为例,产业应用对AI计算需求跃升至“无所不能”,涉及多种计算加速、可扩展性、训练速度快、能效比高、开发难度小、可加快上市等,在这一发展态势下,传统的异构计算将失去“用武之地”。宋继强解释说,一体化的SoC虽然体积小、能效比高,但扩展性差,增加功能则需重新设计,再走一整套流片流程,上市时间较慢;而分体式板卡虽然比较灵活,时间也快,但整体价格偏高,能效比也不高。
正所谓不破不立,超异构计算成为解决“左右为难”的利器。宋继强解读超异构计算的三大要素时认为,一是有多种架构、多功能芯片,无论是CPU/GPU,还是FPGA、ASIC、Modem内存等;二是需要多节点+先进封装技术的整合,不论是10nm的高端芯片还是40nm、65nm的芯片都能通过2.5D或3D封装“成全”;在“硬”功能实现之后,三是统一的异构计算软件,英特尔开发了通用的one API,一套API就可让用户方便地开发并承接超异构集成带来的利好。
超异构计算将以制程与封装、架构、内存、互连、安全、软件为六大支柱,互相关联,紧密耦合。
具体来看,在制程和封装层面,一方面英特尔10纳米工艺仍继续推动着发展,另一方面先进封装2.5D、3D成为推手。两年前英特尔开发的“嵌入式多芯片互连桥接(EMIB)”2.5D封装技术,成为其异构计算策略的一大关键技术。而英特尔不断精进,在去年年底架构日活动上展示了名为“Foveros”的3D封装技术,开辟了新的先河。2.5D和3D封装解决了传统封装面积大、带宽不足等问题,并可让连接的芯片不只是逻辑芯片和内存,还能把逻辑芯片和逻辑芯片相连,同时实现立体堆叠,让体积减少、功耗降低、带宽提升。
而随着海量的数据推动计算架构快速演进并呈指数级扩展,未来十年架构创新将是创新的主要驱动力。英特尔可提供多样化的计算架构包括标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial),分别应用于CPU、GPU、AI和FPGA。
而英特尔的矩阵战略实现了“端到端”。英特尔有通用CPU集成AI加速,可将深度学习性能提升十倍以上。在专用AI芯片方面,有面向训练的高性能GPU和专门做神经网络加速学习的NNP-L;推理侧也是两路并发,面向边缘端的推理芯片要求功耗更低、性能更强,英特尔有VPU、EYEQ以及嵌入式EYEQ、FPGA等;而数据中心推理的芯片则有GPU、FPGA。如此通过将制程封装和架构设计组合在一起,来有效提升“积木式组合”的稳定度,满足定制化和灵活化的需求。
而在内存、互连、安全、软件层面,英特尔也齐头并进。通过重塑内存层级结构,来破解内存和存储方面的带宽“瓶颈”,提升数据管道的运行速度和系统性能;全面的互连产品包括在祼片间实现互连,从而助力实现大规模的异构计算;在安全至上的数据层面,英特尔着力从端到端全面提升安全性。同时英特尔也深谙“硬件+软件”配合才能给出最好的加速功能,在软件方面创建了统一的OneAPI软件架构,以进一步简化并延伸整个堆栈中的应用开发。
这六大支柱也相当于“六大护法”:以先进制程技术进行设计,颠覆性内存层次结构提供支持,通进先进封装集成到系统中,使高速的互连技术进行超大规模部署,提供统一的软件开发接口以及安全功能。
有了“六大护法”加持,一路狂彪的英特尔释放了超异构计算的最大优势,既可灵活地运用各节点芯片的功能,又解决了内存、连接、功耗以及安全、开发等问题,这些创举远远跳出了以往单纯异构计算的“窠臼”,将为异构计算的下一步发展全面“加速”,亦让“自成体系”英特尔站在了异构计算的“超”起点。
未来对决
万物智联时代作为解决计算能力和功耗瓶颈的有效途径之一,异构计算如今可谓正逢其时。
就异构计算的发展过程来看,异构计算从单纯挖掘并行潜力、到具有加速器的异构计算、再到针对特定应用定制的计算平台、到多种平台的高效融合,在这一过程中,异构计算的演进也伴随着起伏。
而无论谁是异构芯片的“轴心”,首要的仍是封装的“不破不立”。不得不说,英特尔超异构计算的概念,配合制程与封装、架构、内存、互连、安全、软件“六脉神剑”,在伴随着异构计算的“新陈代谢”和发展模式的过程中,破解了总是如影随形的关联制约性,可谓意义重大,使得芯片设计从2D平铺转向3D堆叠,为高性能、高密度和低功耗异构芯片制程奠定了坚实的基础,亦为IC业的发展和突破打开了一扇新的大门,提供了更广泛的灵活性和可塑性。
毫无疑问,在传统芯片架构向异构计算演进、软硬件生态面临颠覆性变革之际,各大阵营的开放、众创、共赢的异构生态体系,将成为异构计算芯片对决的重要衡量。异构计算已走到台前,未来是百家争鸣还是一家独大?让我们等待好戏开场。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。