日前,世界人工智能大会(WAIC)落下帷幕,本届大会吸引了超过300家科技企业同台亮相。作为一家ASIC芯片设计厂商,嘉楠科技不仅展示了近一年的商业落地成果,而且在大会期间正式发布了备受嵌入式开发者期待的AI芯片K510。
近2倍算力增长、全新的计算引擎,以及强大的视频处理能力,勘智K510的发布意味着这家芯片厂商的疫后“芯”生。从2016年起,嘉楠科技就开始琢磨如何将ASIC设计技术迁移到AI领域,始于一颗指甲盖般大小的芯片,这家公司的AI之路已经走了5年。
从2016年AI概念在国内萌芽到呈现燎原之势,直至今日,业界对于AI的估值也逐渐回归理性。潮水退去,曾经的“AI四小龙”已光鲜不再,取而代之的则是人们对芯片的热切关注。随着数据成为新石油,算法和算力正逐渐成为驾驭这个世界的通行法则。与各类算法层出不穷的现状相反,算力的发展则充满了混沌。摩尔定律被反复唱衰,异构计算、DSA概念大行其道,旧秩序濒临崩溃,而新秩序尚未建立。
和众多本土AI芯片厂商一样,嘉楠科技是中国上百家从事芯片设计的公司之一。但不同之处在于,嘉楠科技正式进军AI之前已经进行了3年左右的ASIC芯片研发。ASIC是专用计算芯片,与人们电脑里的CPU不同,嘉楠科技早年研发的ASIC只能用来运行一种名为SHA256的哈希算法。在这家公司的董事长兼CEO张楠赓看来,ASIC芯片在计算效率上是最高的,因此从长远而言,随着算法趋于固定,ASIC芯片将是未来AI芯片的主流方向。
以ASIC设计为切口研发边缘AI芯片
张楠赓是一名80后企业家,不同于那些叱咤互联网江湖的形象,年逾三十就已头染霜白,这部分缘于他所从事的行业。毕竟,在过去十年中,集成电路这一行业在移动互联网热潮下显得寂寂无名。直到今天,芯片才成为人们在饭桌上也会提起的热词。
这一行业的技术门槛之高超过了多数人的想象。张楠赓曾说,即便是外界看来最简单的区块链ASIC芯片,要做到世界领先也至少需要5年左右的时间。张楠赓曾成功研发了世界上第一款运行哈希算法的ASIC芯片,并在2018年带领团队研发了业内第一款7nm ASIC芯片。
虽然“软件定义硬件”这一说法在业界有不少拥趸,但在他看来,软件工程师可能不太会注意到的一点是,计算架构改进可以使芯片算力达到数量级的提升。ASIC芯片就是一个最极端的例子,目前一台主流计算设备的算力已经达到TH/s数量级,即每秒进行1万亿次运算。
作为一名科班出身的技术型企业家,张楠赓在软硬件领域均有涉猎。本科期间,张楠赓就读于北航电子信息工程学院,并在读研期间主修计算机体系结构专业。学生时代他就曾跟随导师参与龙芯项目,并且在宿舍里开启了第一次技术创业。
2013年,嘉楠科技正式成立,并于短短三年内带领技术团队实现从110nm到16nm工艺节点的飞跃。区块链ASIC设计领域取得的成功让嘉楠科技有信心寻觅更多场景。在工程师团队看来,通用计算对于算力的需求确实不高。但是在边缘AI领域,设备需要更优的算力和功耗设计来让AI算法落地。
从区块链ASIC转向AI芯片,最大的质疑来自于嘉楠科技能否应对AI芯片设计复杂度的挑战,以及其如何在巨头林立的市场中找到自己的立足之地。
但在张楠赓看来,AI芯片的底层逻辑依然是对数据流的处理。嘉楠科技在ASIC设计过程中积累了大量知识产权,涵盖算法开发和优化,标准单元设计和优化,低电压和高能效操作,高性能设计系统和散热等,这些都是芯片设计的底层共性领域。公开资料显示,截至2020年12月31日,嘉楠科技累计拥有178项专利知识产权(其中包括144项国内专利所有权、34项PCT国际申请)70项IC布图设计权和105项软件著作权。
依托RISC-V研发自主IP核
2016年,嘉楠科技正式成立AI芯片部门,启动边缘芯片研发项目——勘智AI。研发团队在ISA选型、功耗和功能设计上都全面瞄准边缘AI,并在一开始就确立了依托开源架构研发自主IP核的技术路线。边缘AI芯片的应用场景为边缘服务器或设备端的推理计算,即根据训练好的算法模型对数据进行预测。因为算法的部署位置靠近应用现场,边缘芯片的功耗一般只有5W-10W,并且其时间延迟在毫秒级别。
任何类型芯片的设计中,ISA(指令集架构)是绕不过去的一个环节。它是软硬件相互通信的核心枢纽,负责把软件工程师编写的代码转换为最底层的机器码。自上世纪60年代以来,ISA的变迁先后经历了X86和ARM时代,如今正在向新的方向过渡。随着边缘计算以及多类型设备联网的兴起,中小型设备的计算需要更加灵活的轻量级架构。
这一架构主要指向RISC(精简指令集),并在目前区分出ARM和RISC-V两个阵营。在ARM被初创公司普遍采用的情况下,嘉楠科技却是国内较早基于RISC-V架构进行AI芯片研发的公司。这一选择多少带着些许预见性。2017年图灵奖得主、计算体系结构宗师David Patterson与John Hennessy在《计算机体系结构的新黄金时代》一文中就表示,计算体系结构的第二个机遇是开源的ISA(指令集架构),为了创建一个「处理器的 Linux」,这个领域需要工业标准级别的开放 ISA。
在这篇论文中,作者所列举的第一个例子就是RISC-V。除了开源特点之外,架构自身的简洁性使其降低芯片设计和验证硬件正确性的复杂度。同时,这款ISA避免了对微架构的过度依赖,没有历史包袱,而且为定制化设计的加速器提供很大的操作指令设计空间。
过去5年,嘉楠科技一直沿着自主研发IP核的技术路线行进。芯片整体采用SoC封装方案,依托RISC-V架构和定制的视觉CNN加速器来提升任务处理效率。嘉楠科技第一款AI芯片勘智K210的加速器为KPU,峰值浮点计算速率1.082TFLOPS。在去年7月份,这款芯片成功获得Linux内核支持。
除嘉楠科技之外,阿里平头哥、华为等巨头企业也在基于RISC-V架构研发芯片。RISC-V一度被业界视为ARM的挑战者,特别是在ARM独立性受到挑战的当下。Nvidia和高通都对收购ARM公司表示出极大兴趣,而RISC-V基金会则在中美贸易战的当口主动将总部迁往瑞士。
当前RISC-V备受国内芯片厂商追捧,作为早先吃螃蟹的公司,嘉楠科技并不急于推出新的芯片,始终保持着2年一代芯片的节奏。AI芯片勘智K510于今年3月正式点亮回片,这意味着嘉楠在AI的商业化布局上或有更多动作。
这是一代人的事
从更宏观的视角来看,相比16、17年的概念先行,本届WAIC大会上,更多实实在在的优秀技术成果随之涌现。中国最大AI计算芯片、自动驾驶芯片,以及更多自主研发的架构创新和设计,一起构成了本土芯片行业的全新图景。
嘉楠科技便是本土芯片企业快速成长的一个切片。张楠赓曾表示第一代AI芯片更多是一款工程师视角的产品。彼时MobileNet等视觉算法模型尚未出现,因此在算力设计上稍显滞后。深度学习技术及其应用扩展的速度正在倒逼每一家芯片企业加快步伐。
嘉楠科技的新款AI芯片勘智K510在算力和功耗设计上面向中高端市场。其核心在于团队自主研发的KPU2.0,使得其算力相较于一代芯片有近3倍提升,并且搭载了MIPI高清摄像头接口,提升在视觉应用领域的处理能力。随着K510的面世,嘉楠科技将解锁高清视频会议、车载后装市场和智能门锁等更多应用场景。
对芯片企业而言,找到落地场景就意味着打开市场空间的可能性。新一代本土芯片企业如何在自己的市场撑出一片天,则有赖于更多像嘉楠科技一样的企业给出自己的答案。诚如张楠赓所言,抓住计算架构变革的时代机遇,是我们这一代人的事。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )