身为全球半导体知名"硬汉"的英特尔,为什么越来越开放展现自己的"软实力"?
问芯Voice 日前深入英特尔位于上海的亚太研发中心,与七位专家对话,一窥硬体大厂英特尔怎么看终端侧 AI 的未来商机,以及流淌在血液中的强大软件基因。
英特尔亚太研发中心总经理卢炬表示,研发中心的前身是 1993 年在上海成立的英特尔中国架构开发实验室,现在亚太研发中心已经成长至超过 2000 名员工的规模,目标是"根植中国、放眼世界"。
(图:DeepTech)
英特尔目前在全球有超过 1.5 万名软件工程师,还有超过 1200 万名开发者的生态系统,这些建构起英特尔不为人知的强大"软实力",也是面向未来多元化计算的战略武器。
英特尔的创办人之一 Gordon Moore 提出全球半导体业奉行的"摩尔定律",从此该行业围绕者每两年晶体管增加一倍的概念运行至今,透过各种"续命"方式,摩尔定律虽放缓,但仍是整个半导体行业运行的主旋律。
不过,英特尔在看到"数据"对于未来世界的改变力后,开始将公司的定位从"晶体管"为中心,转变成以"数据"为中心,这对于整个行业是很重要的讯息,更开启计算架构更从传统的 CPU 朝 XPU 扩展的路程。
从"云"而下,终端侧 AI 是未来关键趋势
无疑地,人工智能是当年最热门的议题,从早年的云计算,逐渐演变成终端侧 AI 的商机爆发,这是英特尔非常看重的一个产业趋势。
英特尔视觉计算软件合作部亚洲区总经理高源分析,过去 AI 议题很热,尤其是 AI 训练都是集中发生在云端的,随着 AI 的普及,AI 开始向终端侧渗透,包括电脑、手机、无人机、机器人等设备。
英特尔在终端侧 AI 发展上,分析四大驱动力:
一、低延时要求:举例而言,无人机需要随时随地采集视觉信息,并能非常快速做出反应,我们不可能把视觉信息传到云端,再从云端做 AI 应用,这样太慢了,需要在终端 AI 解决。
二、无网络环境下也可以工作:像是机器人巡检,不可能路经一个没有网络或是网络连接不好的地方时,就无法对周围信息做出判断。
三、隐私保护:比如家庭的私人照片放到云端去后,要如何实现隐私保护?这时就可以交给终端侧做 AI 来执行。
四、节省服务器和带宽成本:软件服务商会希望减少服务器和带宽成本,比如视频应用现在都是 1080p、4K,这些东西通过网络传到后端,面临带宽和后端存储的压力,在后端应用又需要很多的服务器硬件,这个成本压力是比较大的。
再者,后端的设备都是由软件服务商自己投资,如果前端设备已经比较强了,那为什么不用呢?很多软件开发商希望把后端的负载可以转移到前端去,哪怕节省 10%、20%,对他们来说都是很大一笔资金。
上述的四大驱动力让我们看到终端侧 AI 在蓬勃发展,渗透到各种使用场景中,包括是噪音抑制、人脸识别、手势识别、语法矫正等。
再者,高源也进一步分析,软件开发商在考虑选择 AI 实施平台的考量点,主要有功耗、性能、延时,以及是否有足够的设备安装量、有无好的软件工具可以去使用等。
(图:DeepTech)
针对这些考量点,英特尔也提供三类不同架构给不同的终端侧 AI 应用,包括 GPU、CPU 以、低功耗 AI 加速器。
一,GPU 平台:
特点是高度并行化,因此适合一些很高性能的 AI 计算,同时 GPU 另外一个特点是数据处理带宽很大,但是它的延时比较高,也就是说让 GPU 跑起来的动作延时是比较大的,因此适合于计算密集,大量的视频分析这类的操作。
可能很多人不知道,其实英特尔是全球最大的 GPU 供应商,这就好比一提到显卡,大家就直接想到独立显卡,但实际上独立显卡的份额是很低的。
调研机构统计,Nvidia 的独立显卡在全球份为约 16%,而英特尔在全球集成显卡市场的份额高达 67%。
再者,集成显卡和 CPU 是共享系统内存的,所以在很多 AI 应用当中,图形图像类的应用,是不需要在 CPU、GPU 之间来回拷贝内存的。
二,CPU 平台:
最大特点是无处不在。站在软件开发商的角度而言,如果做一个终端侧的应用只是为独立显卡设计,那边只有 16% 的市场份额,反观 CPU,几乎是放在哪儿都可以跑的。
CPU 另一个特点是软硬件非常统一,无论是英特尔或是 Nvidia 都是 X86 架构,OpenVINO 在 X86 上都可以跑。
但是 GPU 软件开发平台就比较分散了,因为 GPU 是三家分治的。
Nvidia 开发需要用 CUDA,英特尔的需要用英特尔的工具,为 AMD 开发需要 AMD 的软件工具,因为 GPU 是三家分治的,这对软件开发商来说就会比较头痛。
三,低功耗 AI 加速器:
英特尔专门设计的低功耗 AI 加速器 GNA 不是一个独立的硬件,它是专门设计的电路,集成在 CPU 处理器当中,不需要做额外添加硬件。
GNA 的特点是功耗小于 100mw,所以可以一直开着不需要关,这特别适合语音应用,比如说语音唤醒,因为电脑需要长期去听声音,而 GNA 的功耗特别低,这就非常适合。
英特尔虽然有不同的硬件架构,不同的硬件平台,但在软件编程工具上是统一 OpenVINO 接口,方便在不同架构之间做一些尝试和迁移。
在软件工具上,除了有 MKL,也对接市场上主流的 AI 框架例如 TensorFlow、Caffe 等,以全平台来帮助业内终端侧 AI 的发展。
(图:DeepTech)
以"数据"为中心的时代启程
随着英特尔不断深化以数据为中心的转型,身为科技界资深硬汉的英特尔,也开始强调"软"实力。
其实,软件早已经是英特尔非常重要的战略资产,也证明了对于提升硬件架构每一个数量级的性能,软件能带来超过两倍的性能提升。
卢炬表示,随着人工智能、数据中心、物联网、下一代网络、自动驾驶等工作负载不断涌现,开始需要在 CPU 核心能力的基础上,构建 GPU、FPGA、AI 芯片、视觉处理芯片等不同类型的计算架构,来满足工作负载的需求和增加。
从以 PC 为中心到以数据为中心的转型过程中,潜在市场规模已经扩大到约 3000 亿美元,目标的客户更多,需要解决的问题更多,也代表着需要更强大的朋友圈。
朋友圈也意味着"生态系统",英特尔在这块是长期的深度耕耘,因为整个计算架构不是原来的单一的 CPU 架构,从 CPU 到 XPU,软件在其中起到很关键的桥梁作用。
热情拥抱开源
面对"开源"这个热门议题,英特尔也强调,已经拥抱开源软件有近 20 年的时间,内部更成立一个团队叫"开源软件技术中心"。
英特尔亚太研发中心开源首席科学家冯晓焰表示,在 2005 年初时,英特尔当时的 CEO 做过一个承诺,就是英特尔推出的所有驱动软件,在提供 Windows 解决方案的同时,也要提供 Linux 解决方案。
多年来,英特尔的软件产品组合更是不断增加,开源生态系统项目也越来越广泛,
面对以数据为中心的时代迎面而来,这样的长期布局与积累是正确的决定。
冯晓焰解释,英特尔在开源方面的贡献是历史悠久,同时也是各类开源社区的一员,是 Linux Kernel、Chromium OS、OpenStack 等开源社区项目的重要贡献者,也是 Linux 基金会、Apache 基金会、Eclipse 基金会、开源软件推进联盟的主要支持者。
从英特尔开始做开源软件,Linux 内核、Kernel/KVM 是建立各种云服务最重要的基础软件,英特尔在社区里的代码贡献量常年来是高居第一。
在开源软件的投入方面,冯晓焰进一步举例,英特尔推动了 OpenStack 国内的社区的活跃和广泛应用,更有专门做 OpenStack 的团队,并建立了专门针对云服务提供商 CSP 提供支持的团队。
英特尔在开源软件领域如此使力,目的是希望整个基于开源软件的解决方案,能够在英特尔平台上运行得更好,有最好的用户体验。
(图:DeepTech)
"沉默数据"需要 AI 来挖掘价值
身为英特尔架构、图形与软件部(IAGS)资深软件架构师黄晟盛也分享了他的观察。
黄晟盛指出,全球有超过 50% 的数据是在过去两年中产生,但其中只有不到 2% 的数据是经过分析,这代表着大部分都是属于"沉默数据"。
其中原因之一,是人工智能从实验室到真正生产线的过程当中,缺少统一的数据分析和人工智能技术工具。
黄晟盛进一步分析,现在许多人工智能应用面临的挑战包括算法的复杂性、数据处理的复杂性、成本、是否可扩展、专有接口、数据隐私等。
英特尔也举了基于 Spark 开发和开源的两个项目:BigDL 和 AnlyticsZoo,作为例子。
黄晟盛指出,京东在采用英特尔的方案后,目标检测和图片特征提取方面,相较于原来的方案有 3.83 倍的提升,美的工业视觉检测云平台的预处理性能提高 4 倍,推理性能提高 16 倍。
英特尔更在今年 6 月在中国设立大数据分析和人工智能创新院,目的就是面向开源社区、学术界、合作伙伴、终端用户等,持续推进大数据和人工智能全球生态圈的共建。
英特尔亚太研发中心机器学习首席工程师林晓东则是笑称自己是"码农的码农",很多人用编译器、调试器、调优器、编程语言和框架等工具开发,而他的任务就是优化这些编译器、框架、各种库等的效率,而当前最重要的是针对 AI、深度学习的开发者。
林晓东表示,英特尔做软件的核心意义在于 enabling 和 optimization,终极目标是让所有硬件的每一个晶体管都能派上用场且能力尽情释放。
他进一步解释,这个团队刚开始是世界的软件到中国做本地化,现在会根据中国的具体需求,来创造软件并服务全球。
他举了一个实际的例子。从 Broadwell 到 Skylake,软件与硬件结合提高机器学习的性能 277 倍,再者,从 Skylake 到 Cascade Lake 性能增长 28 倍,其中通过硬件提升了 4 倍左右,其他都是由软件优化带来的,这当中就是包含英特尔与中国客户在交流的过程中,理解当中的工作负载需求,而做出的一些特殊的优化。
再者,英特尔也持续提供简便且可扩展的工具,像是 oneAPI 将简化并统一了跨 CPU、GPU、FPGA、AI 芯片和其它加速器等不同架构之间的编程。
还有 OpenVINO 工具包,实现了高性能计算机视觉和深度学习视觉应用的快速开发。
英特尔也观察到传统产业对于人工智能的需求。
林晓东指出,除了服务大客户以外,也观察到很多传统企业遇到挑战,他们有数据,也知道人工智能和深度学习能帮助解决问题,但却找不到相应人才,这时候,英特尔的本地团队就会对这些中国企业提供支援和帮助。
英特尔中国区云计算软件性能优化团队总监李宏分享,针对客户的工作负载进行优化的能力,帮助客户和合作伙伴加速创建应用并推向市场,是公司一个很大的任务。
李宏表示,性能与优化,贯穿于计算机技术发展的各个历史时期。英特尔在合作伙伴和软件方面的投入是长期,与合作伙伴一同做项目、做工程,也帮助对方培养人才,估计今年我们和中国区的合作伙伴已针对约 70 个不同应用程序进行了优化,年底有望到 80 个,涵盖人工智能、搜索引擎、媒体处理、存储等,其中超过一半的项目和 AI 相关。
英特尔也长期投入高校合作,培养未来的创新人才。亚太研发中心高校合作经理颜历表示,英特尔对于做教育一直非常有激情,因为英特尔的核心基因就是"创新",而教育是培养创新人才的利器。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。