1秒钟能够干什么?译出半句话还是1.6万字的复杂文章?
1分钟能够干什么?看个剧情梗概还是中英文字幕齐备?
机器翻译能否代替人工翻译?关于这个问题,尚无定论。
但随着机器翻译水平不断提高,这一天似乎又近了一步。起码企业级应用方面,快速需求和大量数据的门槛,似乎已经将人工译员拦在门外。
尽管谷歌、微软等互联网巨头纷纷入局机器翻译服务领域,但是垂直级机器翻译由于对数据和算法要求极高,迟迟没有巨头涉足。
为了填补了这一领域的空白,中译语通凭借丰富的语料数据和不断迭代的算法率先推出MerCube,要知道,这是真正意义上的全球第一个企业级机器翻译硬件。
AI魔方一出,谁与争锋!
2018年7月31日,中译语通旗下一个名唤MerCube的AI魔方横空出世,作为一款企业级人工智能服务器,想要为未来发展赋能。
中译语通成立于2013年,2014年6月发布了中英机器翻译引擎,成为了继谷歌、微软、百度之后国内最早自主研发机器翻译引擎的企业。
而后2016年,随着机器翻译水平发展,准确度和速度大幅提升,中译语通的NMT中英机器翻译引擎上线,是国内最早对外提供NMT服务的企业。
中译语通CEO于洋介绍:“机器翻译领域里都是大块头的玩家,在这个道路上能坚持下来实属不易,目前中译语通已经做到以37个语种覆盖233个国家和地区官方语言中的224个,对官方语种的支持覆盖世界总人口超过90%。”
万事俱备只欠东风,2017年5月,在市场驱动下,中译语通开始打造MerCube的雏形。
To C竞争激烈,To B则是新的突破。虽然机器翻译技术不断革新,但是服务方式却像被时光遗忘,从未有更新的痕迹。
面对这种情况,中译语通相关负责人表示:“机器翻译水平不断提高、企业本地化部署需求以及安全性和速度等市场刚需驱动下,中译语通决心打造MerCube,将前端服务与定制化硬件引擎串联。”
据悉,由于用户量增多、对于安全性和保密性提出新的要求,各种杂牌硬件、CPU的稳定度和适配度已经无法满足企业需求,所以企业级人工智能服务器应运而生。
而且在信息安全越来越被重视的今天,MerCube提供专属的私有化部署方式,信息在受控环境下运转,原文本、译文本地化存储,从根源上解决了数据安全问题。
从软到硬,深度定制
人工智能企业四要素:数据、算法、场景和硬件,多年来中译语通深耕数据、算法,从软件到硬件,定制化打造MerCube。
据了解,MerCube搭载了NVIDIA有史以来极其先进的数据中心级GPU Tesla V100,其可提供比 CPU 服务器高30倍的处理能力。MerCube采用了NVIDIA® NVLink™技术,提供更高带宽与更多链路,可提升多 GPU 和多 GPU/CPU 系统配置的可扩展性。单个 NVIDIA Tesla V100GPU 即可支持多达6条 NVLink 链路,总带宽为 300 GB/秒,这是 PCIe 3 带宽的 10 倍。
以机器翻译和语音识别为例,MerCube MT G4单台处理能力可达到8000字/秒,MT G8单台处理能力可达到16000字/秒,MerCube ASR可实现将1小时的音视频在1分钟内识别、解析完成并导出文件。
机器翻译可以说是目前中译语通产品的核心,并基于此研发了网页翻译插件、文档翻译系统、字幕通、视频解析软件等产品与MerCube MT硬件可无缝对接,在保证安全性的基础上解决用户的全方位需求。
以文档翻译为例,一篇45000+字符的医疗学术论文用中译语通的文档翻译只需几秒钟,要注意这是在不排除网络卡顿的前提下得出的数据。而且,文档翻译付费版的价格也只是每千字一元;但如果选择企业级的应用服务,那么只需要支付硬件和应用的钱就一次性搞定了。
此外,MerCube MT还提供定制化服务,会结合用户数据及自身通用数据,提供专属的机器翻译引擎。除机器翻译、语音识别外,MerCube还可将图像识别、视频解析、NLP算法、知识图谱等人工智能算法和引擎内置其中,并与硬件完美融合。
换句话说,MerCube是AI技术的可视化载体,可将翻译引擎、语音识别引擎、NLP处理引擎、音视频处理引擎灵活匹配,构建用户独有的AI智能硬件产品,为用户提供定制化的AI服务。超快的翻译速度,完全可轻松应对企业海量信息翻译需求,极大地节省企业人力、财力支出。
正如中译语通CEO于洋介绍,MerCube实际上是一个All In one的解决方案,在满足企业业务需求的同时,可以解决服务效率、数据安全性、模型适应性等问题,是真正能够在企业里成熟商用的解决方案。
目前,MerCube在医疗、金融、科技、政务等不同领域均有所应用,中译语通对比百度、微软、谷歌等行业巨头,由于发展重心不同,背靠中国对外翻译有限公司,数据量天然占优,似乎未来发展更有想象空间。
众所周知,高水平高质量的语料积累,是机器翻译的重要基础之一,登记在册的超过50亿句对的平行语料,100亿单语语料,每年还在以2亿句对平行语料,5亿单语语料的速度在增加,就是中译语通最大的优势。
此外,字幕通、视频解析也是中译语通主打的服务,现场演示中,几十分钟的视频可以在1分钟内自动添加中英文字幕。
不过,于洋表示:“在一些特殊的小语种中,一个句对平行语料的成本超过1块钱。如此雄厚的积累,是我们的任何竞争对手都不具备的。”
百亿规模,有待开发
据中译语通方面介绍,一整套的MerCube从引擎、硬件到软件价格不菲,但相应的,企业海量信息翻译需求得到满足,从而节省的企业人力、财力支出则达到了另一个量级。
有业内人士预测,目前企业级人工服务器的规模已经接近10亿,除去金融、医疗、科技等领域,尚有百亿级的市场有待挖掘。而且短短几天,MerCube近千台的订单似乎已经能够证明,企业级服务器可以为未来发展赋能。
iPhone自诞生开始,便凭借划时代的操作和系统,开启了智能手机的时代,而MerCube也扮演着和iPhone类似的角色,高性能GPU、定制化应用、高效精准服务...每一项都在吸引着客户,引领着未来。
据了解,目前MerCube在业内暂无竞品,毕竟比起复制其他企业的成功浪费内存,谁都会更喜欢引领市场、徜徉蓝海吧!
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。