日前有消息称,Intel将在代号为“Knights Landing”的下一代Xeon Phi协处理器中配备多达60个核心,而Intel最新公布的资料显示,Knights Landing的核心数量最多是72个!Xeon Phi是用来搭配Xeon、面向高性能计算领域的专用协处理器,目前这种架构已经在很多超级计算机中得到应用。
Intel透露说,Knights Landing的核心架构是Silvermont,是的,你没看错。这个Silvermont就是平板机和迷你机上的Bay Trail处理器的核心,虽然这种核心规模不大,本身性能不是很强悍,但是通过多达72个核心288个线程,以及针对高性能计算的各种优化,双精度浮点性能可以超过3TFlops,堪称怪兽。
为什么我们平板,手机上用的Bay Trail处理器核心会成为超级计算机的核心呢?
超级计算机之路
其实,计算机最早的需求就是从超级计算机开始的,无论是实际上第一台机械计算机(英国巴贝奇爵士设计,未最终完成),还是第一台电子计算机eniac,都是做科学计算用的。
计算机发展到PC反而是苹果公司和Wintel联盟出现以后的事情,发展到今天的智能手机则是上个世纪90年代以后了。
计算机性能的扩展有两条道路,一条的不断改进制造工艺,提升芯片设计水平,把单个芯片设计的很强悍,提升性能。还有一条道路是尽可能用比较多的机器并行,用多机机器一起运算来提升性能。
自从计算机出现以来,就一直沿着这两条道路在前进。在这个发展过程中,以深蓝1997年战胜国际象棋大师卡斯帕罗夫为标志,代表了人类智能被机器超越。
从高大上到平民化
早期,超级计算机都是昂贵的高级货,处理器是专门设计的,芯片组是配套的,甚至每根连接线都是定制的。这个成本极高。
而随着PC和网络的发展,人们发现追求强大的计算能力可以不那么昂贵。于是,人们开始尝试用大批量生产的PC或者工作站来攒超级计算机。
若干台PC或者工作站通过网络连接起来,把任务分给这些机器并行,然后返回,计算能力丝毫不弱于昂贵的专用超级计算机,于是传统的超级计算机开始没落。
这个时代出现了很多平民化的超级计算机,譬如用浩鑫HTPC准系统凑起来的超级计算机,把一个学校的MAC电脑凑起来的超级计算机等等,这些看似玩具的东西居然一度占据了TOP500超级计算机排行榜,甚至谷歌自己用的服务器也是用这种办法攒出来的。
而在这个过程中,人们发现,限制超级计算机能力居然是功耗,人们不能堆积太多的数量是因为功率和发热限制,性能功耗比甚至比性能本身更重要。
于是,IBM开发出蓝色基因,不追求单个核心的高性能,而是降低功耗,攒更多的数量来提升性能。但是因为单独开发这种处理器在批量和成本上无法与通用的PC处理器相比,并没有流行开。
Cell和GPU引发的变革
索尼为了提升PS3游戏机的性能,联合IBM搞了Cell处理器,这是异构计算的开始。因为在计算任务中,有些任务是简单的,不需要复杂的逻辑处理,只需要足够的计算单元暴力计算,这样处理器就可以设计成两部分,一个简单的运算核心,几个强大的简单计算单元,这就是Cell的思路。
因为这种计算编程难度太高,所以Cell用在游戏机上并不成功,但是这个思路可以拿到电脑上,这就是我们熟悉GPU通用计算。
因为3D的需求,显卡有强大的计算能力,这种能力只用于3D游戏浪费了,于是在Cell之后就有了GPU的通用计算,CPU处理复杂任务,GPU处理暴力计算,nVIDIA甚至搞出来CUDA专门解决这个问题,而且在GPU的设计上就为通用计算做了优化。
单台计算机异构化,获得强大的计算能力,那么就可以把这些单台计算机联网,组成计算能力强大的异构超级计算机。
于是中国在2009年搞出来天河一号超级计算机,就是CPU和GPU异构组成的超级计算机,一度排名世界第一。百度搞人工智能的计算机也是这种异构的超级计算机。
Intel的反击
如果以后超级计算机全部异构化,那么CPU提供的计算能力只占一小部分,这无疑代表了nVIDIA和AMD要抢Intel的饭碗,Intel当然不能坐以待毙。
于是Intel开始自己做异构用的芯片,这就是Larrabee计划,其实GPU本来就是一个个小的计算核心,然后组合起来。而Intel手里是有小核心的,这就是当年的奔腾一代处理器核心P54C。
Intel把这款20年的老核心集成起来做成众核,做成协处理器,可以做3D显卡,也可以做超级计算机的协处理器。这个项目初期失败了。但是,Intel在这个基础上发展出来了“众核架构”(MIC)的Xeon Phi协处理器。并且获得了天河2号(目前世界第一超级计算机)的选用,Intel扳回一城。
Knights Landing的升级
协处理器的能力取决于小核心的计算能力,P54C这个20年前的核心弱爆了。而Silvermont作为Intel反击移动市场的利器,性能功耗比非常出色,于是,Intel把这个小核心攒起来做成众核的Xeon Phi,这就是Knights Landing。
Knights Landing的72个核心将每两个核心构成一个模块(Tile),然后再通过Mesh网格网络连接在一起,共享36MB缓存,还有816GB HBM高带宽显存充当三级缓存。
在内存规格上,Knights Landing支持六通道的DDR4-2400,最大容量384GB。在扩展方面则集成36条PCI-E 3.0通道,可以在一台主机上插数块,提升几倍运算能力。据了解,中国的下一代超级计算机很有可能用上。
所以,低功耗的移动处理器变身超级计算机核心,实际是技术不断探索发展经过几代进步的结果,随着Intel未来移动桌面合一的计划,超级计算机会更加强大,我们的生活也会随之改变。
本文为百略网(ibailve.com)作者maomaobear原创,首发于百略网(微信公众号:wwwbailve),转载请注明作者与出处。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与深度整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
- 特斯拉首次聘请品牌大使:韩国奥运射击选手金艺智
- 华为研发中心入驻上海青浦致小镇房租大涨,带动周边租房市场热潮
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。