打破“超算服务无法商业化”的魔咒

在当前复工复产的大潮中,各地的数据中心、超算中心等也陆续全面复工建设。5月4日,四川电视台报道,四川省最具代表性的“新基建”项目——成都超算中心已顺利封顶,项目预计下半年完工,并将积极争取纳入到国家超算中心体系之中。十三届全国人大代表、四川启阳汽车集团董事长王麒在今年全国“两会”期间提出建议,以成都科学城为核心区域,建设综合性国家科学中心,而成都超算中心正是科学城的几个重点基础设施建设项目之一。

无独有偶,5月19日,河南省大数据管理局与鹤壁市人民政府签署战略合作框架协议书,其中重要的内容之一便是支持鹤壁建设国家超算中心,承担大规模科学计算和工程计算任务,同时运用大数据、云计算、人工智能、物联网等先进手段推动现代农业的发展。

我国超算产业发展方兴未艾,一方面,各地打造超级计算机,持续壮大国家超算中心体系的热情不减;另一方面,随着“新基建”浪潮的兴起,大数据、人工智能、物联网、5G等新型工作负载不断涌现,人们对强大算力的需求持续升温,这对超算产业的发展将产生积极的推动作用。

人们已经习惯了如下对超算的描述:计算领域皇冠上的明珠,反映了一个国家科技的综合实力,是大国重器。这也造成了超算在人们心目中多年来一成不变的印象——高高在上、阳春白雪。今天,除了科学研究和计算以外,超算已经“飞入寻常百姓家”,在天气预报、基因制药、石油勘探、汽车设计、航空航天、金融期货,乃至人工智能等诸多领域,都可以看见超算的身影。超算似乎已经走下了神坛。

打破“超算服务无法商业化”的魔咒

在近日举行的“中国计算机学会青年计算机科技论坛”(CCF YOCSEF)济南论坛上,“离开国家超算,商业超算能否独立生存”的话题引起了关注和热议。商业超算的市场究竟在哪里?超级云计算能否打破超算服务无法真正商业化的魔咒?超算云服务能否开辟新的战场?在超算市场喧嚣的背后,我们需要的是更精准的客户画像、超算资源的供需平衡、速度与应用优先权更合理的安排……也许只有这样,普惠超算的梦想才能真正照进现实。

超算正变得多元化

中国超算越来越厉害,虽然起步较晚,但是发展速度很快。很多人头脑中慢慢有了这样的印象,很大程度上是因为中国的超级计算机近些年在全球超级计算机榜单 TOP500中屡有斩获, 甚至有过连续多届坐庄的好成绩,其中“天河一号”“天河二号”“太湖之光”更是人们耳熟能详的中国超级计算机的优秀代表。

时至今日,中国超算已经在世界超算领域占有了一席之地。就在我们已经有能力制造出全世界属一属二的超级计算机之时,一些隐藏在“高速度”之下的问题也渐渐浮出水面。

最集中的体现就是“重硬轻软”,具体表现在:我国的应用软件目前仍处于初级阶段,应用与软件研发存在脱节现象,一个典型的例子是日常运行的超算作业,其并行规模仍停留在千核级别以下,不能充分发挥亿亿次超级计算机的并行能力,尤其是在超算应用较多的制造业和基础科研领域,大部分的商业应用软件都来自国外,而我们的软件几乎都是科研用软件, 不具备大规模商业推广的能力和条件。

正因为如此, 有人提出了超算能否从阳春白雪走向下里巴人,超级计算机的发展到底应该是速度为王还是应用为王等疑问。

打破“超算服务无法商业化”的魔咒

我国超级计算机的研制模式基本都是由政府科技部门主导,地方政府参与,企业承担研制任务,国家超级计算中心负责运维和推广。不可否认,这种模式是经过过去20多年的实践和验证,使得我国在超算领域异军突起的重要基础和保障。

但是在从跟跑进入到并跑,甚至部分技术领跑的新阶段后,很多专业人士也在反思,会不会因为我们以前太重视超算领域TOP500 这样的“金牌”之争,反而放松了对于提升超算整体应用水平这样类似“全民健身”的要求?再加上软件发展没有实质性突破,自研应用少、应用场景不完善等问题依然存在,以及采用商业模式运营的超算中心成功的案例凤毛麟角, 导致商业超算缺少良好的生态平台,无法满足千行百业对商业化大规模超算应用的需要。

找到了问题所在,然后有效地解决问题,我国的超算产业才能实现又一次飞跃。国家超级计算天津中心主任助理冯景华认为,国情不同,超算的应用模式也不同,国家超算和商用超算并不矛盾,超算肯定能产业化,而且产业化手段非常多。国内的国家级超算中心都在积极探索适合自己的创新发展之路。

技术创新驱动应用创新,反过来,应用又是技术的试金石,是技术持续提升的基础和源泉。 其实,速度为王或应用为王并不矛盾,从产品的角度出发,就是速度为王;从客户和业务的角度出发,就体现为应用为王。超算落地,其核心还是以应用为王。

但在超算发展的不同阶段,应根据实际的需求和目标的设定,及时调整速度为王或应用为王的优先级。现在,超算的发展正处于一个关键的转折期,企业的云化转型、智能升级迫切需要超算提供的强大算力和支撑。从整体趋势来看,超算会逐渐从重视速度变为重视应用,并将对应用进行更细粒度的划分,不同的场景需要不同的解决方案。

用户的规模不同、需求不同,对技术能力的要求不同,运维的复杂程度不同、成本也不同。面对这么多不同,超算应当进一步划分等级和客户群,针对不同客户提供不同规模、性能的超算服务。

国家超算面向大型、重要的用户,而商用超算可以解决大量中小型用户的需求。从这个角度说,商用超算是国家超算有益的补充。

在“新基建”的浪潮下,我们看到各类超算中心也在探索多元化的运营模式,致力于提供全谱系服务。在用户多样化需求的牵引下,随着技术的不断发展,将超算的算力分离出来,实现定制化,同时降低超算的使用成本,超算普惠是可以实现的,比如超级云计算模式、云超算等就是有益的尝试。

需要明确的一点是,国家超算是一种战略资源,不能全部做商业化的探索。但是在条件具备的情况下可以进行多元化运营模式的探索,这有助于打造良好的超算生态,推动整个超算的大规模商业化进程。

给客户画像 超算市场三分天下

一提到超算,很多人最直接的联想就是超级计算机,甚至就在超算与超级计算机之间划上了等号。其实,超级计算机只是丰富的、多层次的超算应用的金字塔尖,而不代表超算应用的全部。业内之所以有关于国家超算与商业超算能否并存的探讨,也是从客户的实际应用需求出发,看到了划分超算场景和客户群体的必要性和商业价值。

北京并行科技董事长陈健从商业角度将超算行业划分为“尖端超算、通用超算和行业超算”三大细分市场,并为三大市场的客户进行画像和产品定位。这种对超算行业生态立体化的描述,有利于超算厂商和服务运营机构进一步明确目标客户,提供更有针对性的解决方案和服务,更加充分地发挥超算的威力。所谓尖端超算,一个“尖端”已经直接说明了这类客户和这类需求的特殊性。

打破“超算服务无法商业化”的魔咒

通常来说,尖端超算的客户部署的是“万核”以上的应用。他们追求“三极”,即极大的规模、极高的超算硬件系统要求和极致的性能。能够驾驭尖端超算的必定是高端超算的从业人员,来自于攻坚型科研、国家级客户或各行业顶级研究机构。

称得上是尖端超算的产品,毫无疑问,一定是“塔尖上的明珠”“国之重器”。具体分析,尖端超算产品无论是在计算、访存、通信,还是I/O 场景下,都具有十分出众的能力,是性能设计平衡的高端超级计算机。“太湖之光”“天河二号”等就是尖端超算的代表,凡是去实地参观过设备的人无不啧啧称赞。众所周知, 这些尖端超算产品需要国家大力投入,集中科研力量进行攻关,目的就是集中力量办大事,解决一些重大、棘手的科研难题。因此,不能简单地核算其性价比,必须以速度为王。

提供尖端超算服务的代表就是国家超级计算中心。国家超级计算中心是由科技部批准成立的,截至 2019 年,科技部批准建立的国家超级计算中心共有七家,包括国家超级计算天津中心、国家超级计算广州中心、国家超级计算深圳中心、国家超级计算长沙中心、国家超级计算济南中心、国家超级计算无锡中心和国家超级计算郑州中心。可以说,它们是中国超算的脊梁。 现在仍有一些地方政府在大力兴建超算中心,希望进入到国家超算体系之中。

中科院计算所研究员张云泉介绍说,从实践来看,我国超算在建设思路上采取了优先发展超算系统的性能,然后再拉动超算应用发展的策略,这种方式虽然在短时间内拉近了我们在设备端与世界先进水平的差距,但是也会导致超算系统初期应用效率偏低等情况的出现,需要一定的过渡期,才能让超级计算机的资源和能力得以充分释放。

反观欧美日等国家,它们的超算发展模式是,根据行业和应用领域的实际应用需求,有针对性地研制能满足实际应用需求的超算系统,这样可以有效避免对机器的浪费,形成了供需的动态平衡。

打破“超算服务无法商业化”的魔咒

采用通用超算的客户,其应用主要在万核以下,其中绝大多数是千核以下的应用。这类客户的代表是那些海量的自身无超算资源但又想使用超算服务, 或是当前在自主建设中小型超算系统的客户。这类客户的核心需求表现在,需要优质的服务,而且特别关注性价比。

通用超算可以针对不同类型的应用,按照动态随需增长模式,提供最高性价比的超算服务计算资源,从而将那些不得不自建超算系统的客户解脱出来,以租用的方式更方便快捷、以更低的成本使用超算服务。

通用超算的代表是超级云计算中心。我国的一些国家超算中心已经在尝试这种模式,并且取得了不错的效果。另外,像北京超级云计算中心,便提供商业运营的通用超算服务平台,用户数已经突破2万,并且仍在持续快速增长。北京超级云计算中心不仅拥有强悍的处理器、 专业的平台优化能力,而且可以根据用户需求进行动态扩容,避免了用户排队,同时保证了计算的顺畅。一句话,北京超级云计算中心可以为各类企业提供优质的超级计算和云计算服务。

行业超算的客户可能是范围最广、应用需求差异最大的一类客户,其应用可从单核跨越到几千核。这类客户最关注服务,然后是性能和性价比。与其说这类客户关注超算,还不如说他们更关注的是业务本身,因为超算只是他们用来满足业务需求的一个环节而已,其终极目标是实现完整业务云化,同时保证业务运行的稳定性和可靠性。

行业超算,顾名思义就是面向不同的行业需求,按照各行业的实际业务需求设计完整的云上业务流程,并且保证业务各环节能够快速、高效、动态实现,具有弹性和高性能、高稳定性、高可靠性、高可维护性。行业超算的实现方式通常是“公有云/超算云+ 专业超算服务商”。

以阿里云、腾讯云等为代表的公有云服务商最近几年加快了在超算领域的布局。以公有云的方式交付超算资源和服务,可以发挥云本身灵活、低成本、服务化等优势,加速超算普惠的进程。举例来说,早在2018 年初,腾讯云重庆黑石数据中心便对外提供超算云服务,将超级计算机集群部署在云端,满足了重庆当地工业企业对高性能计算的需求,让他们享受到云服务带来的种种便捷。

另外,阿里云的弹性高性能计算平台E-HPC面向的是传统对高性能计算有强烈需求的高校科研机构和企业用户,能够大幅度降低人工智能计算门槛,很好地诠释了公有云上的HPC as a Service。阿里云表示,E-HPC不仅可以一键部署,而且是可媲美大型超算集群的云上超算中心。

我们虽然按照客户需求和产品特性将超算划分成三大市场,但这三大市场之间的界线并不是泾渭分明,比如通用超算与行业超算之间就有交叉,最终还是要根据客户的实际需求判定采用哪种解决方案或服务。

“有些人可能会迷信超级计算机。但是超级计算机不可能为一些小应用更改配置,更不要说定制化了。这就好比手里攥着一把巨大无比的锤子,到处找小钉子砸。既然有通用超算、行业超算这样顺手的小锤子,为什么不用?用小锤子砸小钉子可能会事半功倍。”陈健表示,“我们从给客户画像入手,先明确用户的需求,再找对路的产品和服务,这样可以更好地满足超算商业化的需求。”

将超算划分成三大市场,最直接的效果是将客户需求梳理清楚,引导客户对号入座,选择最适合自己的超算服务,而不是非要千军万马争过国家超算这一座独木桥。商业超算也有自己的擅长,在某些场景下可能更经济、更高效。俗话说,杀鸡焉用宰牛刀,就是这个道理。不同的设备对应不同的最适合的应用场景,既不要大材小用,也不必一味追求“高大上”。

调查显示,大部分企业客户的计算需求都在千核以下,通用超算或行业超算完全可以满足需求。统计数据显示,我国传统超算市场的整体规模达280亿元,其中尖端超算目前大约占四分之一,而通用超算占四分之三。行业超算包含了行业应用软件市场,是后起之秀,增长势头迅猛,预估市场份额约为1000亿元,假以时日很有可能颠覆目前的超算市场格局。

国外的超算市场更加成熟,也相对简单,尖端超算数量并不多(比如NASA),通用超算和行业超算的用户主要都是由云计算公司来提供服务。在国内,尖端超算的规模还在不断扩大, 但是仍有很多企业用户在自建超算系统,这说明在超算市场上还存在供需不平衡的情况。在电商领域,有了天猫和京东,为什么还会有拼多多异军突起?这是不同的市场定位、不同的客户群体和需求决定的。在超算领域,尖端超算、通用超算和行业超算三大市场会进一步明确和细分。

超算云服务异军突起

明确应用需求,找对适合的产品,接下来就是如何落地,也就是超算商业化这个要探讨的核心问题。

超算商业化的一个重要前提是,有海量的客户需要超算应用,但是这些应用不必运行在超级计算机上,而用户自建超算系统又不划算,这时商业化的超算云服务就是一种新的选择。并行科技就是一家提供专业化超算云服务的供应商。从某种程度上说,它像是一个聚合各种模式超算服务的“中间商”,通过它的整合和调度,用户可以获得与自己业务匹配的尖端超算、 通用超算和行业超算。并行科技与多个国家超算中心保持密切的资源往来,可以帮助客户建设超级云计算中心(比如与北京超级云计算中心携手共建),同时还与阿里云、华为云等公有云服务商结成了合作伙伴。无论客户有哪类超算需求,都可以先找到并行科技,由它负责匹配具体的超算资源和服务。目前,并行科技服务的超算客户超过了2万,其中大多数还是以科研为主,合同金额从几千元到几百万元不等。

打破“超算服务无法商业化”的魔咒

投资界的人刚接触到超算时,总会有点敬而远之,因为大家担心超算是重资产投入,以为会建大型数据中心,包袱太重。其实这是一种误解,超算领域有很多供应商,比如超算云服务商并行科技就是一家轻资产公司,虽然它背靠的是超算中心、超级云计算中心和公有云这些资源池,但它本身的特长还是在PaaS和SaaS 层,可以根据用户的需求动态扩容这些资源池,避免用户排队,最大程度地发挥超算资源池的作用。并行科技是一个超算云服务的统一出口,它将超算资源标准化,并按其性能、质量等销售给客户。

在数据中心领域,数据中心的建设与运营有逐渐分离的趋势,轻重资产由各自最擅长的企业经营,前一段时间鹏博士动作频频正是为此。在超算领域亦是如此,并行科技就是“吃螃蟹的人”。陈健表示,并行科技的初衷是以SaaS化构建立体超算行业生态,打造新的行业增长点。并行科技与超算资源提供商之间就像是电网与电厂的关系。有了多个不同“电厂”的支持,并行科技可以向客户直接输送成本最低的“电”,同时保证服务最优。

超算迎来“黄金时代”

市场研究公司Hyperion Research的数据显示,从2017年到2022年,全球超级计算机市场规模将翻一番,超过95亿美元。AI的爆发为超算的商业化和普及应用又添了一把火。据悉,一批新崛起的中国本土私募基金也将AI应用于投资决策,有的还投资建设了自己的新一代AI 超级计算机。

超算市场还在成长壮大。尖端超算是一个国家的科技命脉,仍会向着“更高更快更强”发展,而通用超算和行业超算可以预见其增长速度将更快,三大市场各有自己的区间,互相不可替代。

我国正走在从“超算大国”到“超算强国”的道路上,不仅要在硬件上攻艰克难,更要在算法和应用软件上寻求新的突破,再迈上一个新台阶。超算正处于“黄金时代”,它不仅需要产品、技术和应用上的创新,更迫切需要商业模式上的创新。超算云服务、超级云计算中心毫无疑问将成为超算商业化的有力推手。

(说明:文章来源《中国信息化周报》)

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2020-06-17
打破“超算服务无法商业化”的魔咒
在当前复工复产的大潮中,各地的数据中心、超算中心等也陆续全面复工建设。

长按扫码 阅读全文