当超算遇到人工智能,将会在科技产业引发怎样的链式反应?

AI(人工智能)如此多娇,引无数英雄竞折腰。据相关调研报告预测,到2020年,全球AI市场规模将有望达到1190亿元,预计年复合增长率可达19.7%。

而HPC(高性能计算机,也常被简称为超算)的发展的水平,则代表着人类利用工具、不断拓展认知边界的极限。人工智能和超算,是目前人类科技领域近阶段最火热、最前沿的两个分支。

当高速运动的粒子碰撞之后,可能引发链式反应而释放出巨额能量。那么处于高速发展状态的AI和HPC相遇,两者的碰撞交融,将会在科技产业引发怎样的链式反应?AI和HPC做融合创新,挑战和机遇主要有哪些?6月30日,在2017联想全球超算峰会上,这些悬疑有了清晰的答案。

为什么AI会跟HPC会成为智慧时代的好CP?

“未来,我们将进入一个人工智能研究及应用创新集中爆发的时代,人工智能只有在强大计算力的支持下,通过和成熟的算法、大数据相结合,才能真正做到改变世界。”联想集团高级副总裁、数据中心集团中国区总裁童夫尧如此辩证地看待超算与人工智能之间的关系。

算力、算法和大数据的进步,是AI发展的三大基础。AphlaGo之所以接连战胜人类顶尖围棋选手,一方面得益于蒙特卡洛算法的突破,但AI服务器性能的提升、数以万计的棋手对弈大数据,也是不可或缺的要素。事实证明,算力、算法和大数据,人工智能这三大要素者之间是相互依存、相互制约的关系。如果算力不足,那么有再多的数据也无法进行有效地驱动和利用;如果算法停滞不前,那么在当面对多数据层级时,现有算力就会力不从心;如果没有足够庞大和关联的数据,

那么就像一部有绝佳性能的发动机和变速箱的超级跑车,但却没有燃油一样,AI真正的威力也无从发挥。

无论是人类遗传基因密码的解密,还是做太空天体物理学计算,或者是利用气象云图做精准地天气和灾害预报……大量应用中遇到的算力瓶颈,让人类在不断地探索HPC性能极限。目前在TOP 500排名第一的神威·太湖之光超级计算机,峰值性能125.436PFlops,但如果想达到E级计算的要求,则需要在威·太湖之光的基础上性能在提升十倍,在摩尔定律即将失效的今天,HPC在追求性能的同时也需要应对不断提升的功耗挑战,在功耗优化上,AI就可以大展身手。

AlphaGo在深度学习上的算法成果,被谷歌用在了一个试点数据中心的能源优化上,结果该数据中心的能耗降低的40%,这大大增强了人们用AI来让大型数据中心节能的信心。

HPC超强的算力,可以让AI插上算力提升的翅膀,而AI也会反过来帮助HPC实现更优化的资源分配和能源管理,所以,在智能时代,HPC和AI成为了一对能互补和相互助力的好CP。

HPC+AI,将带来什么样的机遇和挑战?

可能会有朋友在思考,既然HPC和AI是一对好CP,那就让他们在一起好了。但事实上,AI和HPC是两个既有一定交叉,但又保持着很强独立性的学科,在现实中,HPC和AI的发展,各自都存在着一些严峻挑战,单独解决起来都很困难,更何况要让HPC和AI能协同创新。

联想数据中心集团HPC与人工智能业务高级总监Luigi Brochard在演讲中指出,目前人工智能在机器学习方面实现了巨大的突破,但人工智能要想在应用层面在做突破,将面临三大挑战:第一,就是数据,大量的数据,既有结构化数据,又有非结构化数据,所以如何打通数据类型、结构的壁垒,让大数据能被有效利用,这是第一个挑战;第二,是人才的挑战,人工智能是一个全新的科学领域,有很多大学刚刚开始设立这个学科,目前人工智能方面的人才还非常紧缺,人才的短缺是第二个障碍。还有第三个障碍,就是资源的问题,存储、计算等硬件需要各种各样的架构,执行起来非常复杂,还有一些专用软件,对使用者的界面也很不友善,这三大挑战形成了人工智能继续发展的障碍。

据Luigi Brochard介绍,为了解决这些挑战,联想宣布将在美国莫里斯维尔、德国斯图加特和中国北京,设立三个开放型的全球AI创新中心,联想会把最佳的基础设施放在这些创新中心,与联想的合作伙伴共同在AI创新中心开发全新的AI解决方案。联想将在这三个AI创新中心投入优渥的资源,比如联想顶尖的人工智能技术专家,还有最好的AI基础设施,以及快速入门工具,来集合产业聚合之力,共同应对AI发展的挑战。预计这三处AI创新中心将在2017年底完成建设并正式启用。

因为AI和HPC分属于不同的计算机学科分支,所以AI和HPC如何做协同创新,也是非常一个非常现实的问题。在2017联想全球超算峰会上,深腾8810集群的惊艳问世,让我们看到了AI与HPC深度融合创新的曙光和实现路径。

据联想数据中心集团HPC方案总监李炜介绍,深腾8810集群由联想自主研发,拥有多项HPC和AI的关键技术,包括46项国家发明专利。其搭载的全新HPC+AI智能超算平台LiCO,不仅强化了上一代LiCO的全部功能,更在HPC软硬件平台上整合支撑了各种深度学习应用,融合了主流的人工智能框架,比如谷歌的Tensorflow、脸书的Caffe、微软的MXNET等。另外,LiCO分布式的资源调度系统,可以帮助用户从容应对各种深度学习训练不断增长的计算需求,如:人脸识别、自然语言处理;其任务模板可以让不同类型的用户,如初学者、专家、数据科学家,都能够快速上手; 而LiCO端到端的解决方案包含数据预处理、训练、参数调整、过程监控、测试等,能让用户能够集中精力在AI算法和业务应用,而不是超算平台本身。

李炜在接受采访时明确表示,未来用于深度学习的AI GPU服务器集群,也会面临着功耗的挑战,联想会把HPC领域独有的45摄氏度温水水冷技术应用在AI GPU服务器上,这种底层技术上的互用,会让HPC+AI的融合创新更加有效率。

从领跑HPC到领跑HPC+AI,联想更需要凝聚生态智慧

联想是中国高科技领域的一面旗帜,在HPC领域上体现得更加具体而生动。在不久前结束的ISC 2017上,联想以91套高性能计算系统入围全球HPC TOP500份额榜,连续三年获得中国第一,继续蝉联全球第二。

联想在HPC领域能够领跑中国,其中品质优异和技术领先,都是非常重要的因素。值得一提的是,联想独创的45摄氏度温水水冷技术,相比传统的空气冷却,最高可降低40%的能耗,比其他厂商的水冷技术能耗也低了近20%。通过联想水冷能够使得数据中心的PUE值降低到1.1,这远低于1.8-2.0的业界平均水平,能帮助客户大大节省整体投资,提升AI计算的效能。目前,联想与全球最大的7个数据中心中的6个达成了合作,继续在HPC领域展露锋芒。在上一个财年,联想以17%的增长率成为全球增速最快的HPC厂商。

联想在AI GPU服务器上也走在了时代的潮头。目前,联想是包括BAT在内的众多互联网企业的AI GPU服务器的主要供应商。在京东,联想优化GPU架构后的5000个计算节点,正在支持着其消费者购买习惯分析等算法,科大讯飞、滴滴出行、今日头条等国内在人工智能领先的公司,也在广泛采用联想的AI GPU服务器。

此次联想提出了智慧超算理念,开创了HPC和AI融合创新的一条新路,并在深腾8810集群上初步实现了HPC+AI的解决方案落地。诚然,HPC+AI是一条前人未曾走过的崭新技术道路,联想虽然身先士卒地在探索这个无人区,但如果单凭联想一家去努力,那么成效可能会大大折扣。但值得欣慰的是,联想正在依靠AI创新中心构架HPC+AI的开放生态,当这个开放生态聚合了芯片、软件、硬件、应用等领域众多具有创新意愿的优秀公司,那么就可以利用生态系统的集体智慧,来克服重重挑战,推进人类社会向智慧社会更快演进。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2017-07-01
当超算遇到人工智能,将会在科技产业引发怎样的链式反应?
AI(人工智能)如此多娇,引无数英雄竞折腰。据相关调研报告预测,到2020年,全球AI市场规模将有望达到1190亿元,预计年复合增长率可达19 7%。

长按扫码 阅读全文