机器翻译技术发展与应用,将剑指何方?

——2018机器翻译(成都)论坛侧记

2018年5月26-27日,2018年机器翻译论坛首次线下活动(成都论坛)在成都召开,来自东北大学、澳门大学、大连理工大学、苏州大学、广外、厦门大学、香港城市大学、西湖大学、阿里达摩院、科大讯飞、奇虎360、搜狗、腾讯、网易、云译科技等机器翻译技术研发机构以及四川语言桥、厦门精艺达等十余家国内著名的语言服务企业共计50多名代表出席,一起热议机器翻译的技术发展方向及应用落地场景。

“机器翻译论坛”由小牛翻译团队于2016年发起,旨在聚集国内机器翻译研究学者、机器翻译技术开发者、机器翻译需求方等多个领域的代表,对机器翻译技术发展与应用场景进行深入研讨,迄今已经分别成功举办了2016年沈阳、2017年大连两届年度论坛,已发展成为国内最大的机器翻译产学研交流平台。

此次机器翻译(成都)论坛由小牛翻译和语言桥联合主办,云译科技提供了赞助支持,共有35家单位的42名代表出席,分为“技术与应用报告”与“自由研讨”两个部分,机器翻译报告部分由大连理工大学黄德根教授主持,广东外语外贸大学宋柔教授、阿里达摩院陈博兴博士、新加坡技术与设计大学/西湖大学张岳博士、科大讯飞刘俊华博士、厦门大学苏劲松博士、网易见外刘鹏博士、搜狗翟飞飞博士、厦门精艺达韦忠和董事长分别作了精彩的报告,为大家勾勒出如下有关机器翻译技术发展方向与应用落地场景的新“画像”:

l 机器翻译技术发展越来越快

自神经机器翻译技术在2013年被提出以来,机器翻译已经从统计机器翻译时代全面转向神经机器翻译时代,2016年起神经机器翻译在产业界的应用开始爆发,神经机器翻译模型结构进化、异步双向解码技术、数据增强技术、译文后处理和外部知识干预等技术,以及基于graph的自然语言处理技术,让机器译文质量不断提高,可用性越来越强。

l 机器翻译应用场景越来越丰富

随着跨语言海量信息快速交互需求的不断增加,机器翻译技术成为大数据翻译唯一可行解决方案,各种机器翻译应用层出不穷,目前全球每天机器翻译服务提供的在线翻译量已经达到了1万亿词的规模。机器翻译+行业、机器翻译技术+图像技术/语音技术,推动了语音同传翻译、视频翻译等产品一波又一波的发展,从亚马逊到阿里等跨境电商,从Facebook到微信等在线社交平台,从讯飞的语音翻译机、搜狗的多语搜索、网易的视频翻译,甚至在语言服务业,也已经有超过50%的翻译公司和个人在使用机器翻译。

l 人机结合,优势互补

虽然机器翻译目前可以很好地满足网页浏览等“可读性”翻译需求,但离“优质”翻译需求的距离还很远。广外的宋柔教授指出,从语法角度看,由于机器还无法识别复杂中文句子的内部逻辑关系,对于存在多个“小句复合体”的中文句子,机器明显“心有余力不足”。为了得到高质量机器译文,还需要做更多“译前编辑”“译后编辑”等工作。“2017年全球语言服务市场规模达到430亿美元,近几年一直以10%的速度在稳步增长”这一事实也说明,虽然采用机器翻译提高效率、降低成本已经是大势所趋,但是人机结合、优势互补,仍将会是一个长期存在。

报告结束之后的“自由研讨”由小牛翻译创始人朱靖波教授主持,讨论中技术专家与技术爱好者唇枪舌剑,交流的主要话题涉及到:在机器翻译引擎开发方面,机器翻译开发者与用户需要如何合作,实现通过用户反馈来帮助改进机器译文质量及友好功能;在机器译文质量评价方面,传统的BLEU/NIST等自动评价指标不足以满足评价需求、人工评价存在着代价高、容易产生不一致评价结果的情况下,应该采用哪些方法?比如可以采用众包评价的方式,而在电商机器翻译评价上,可以采用用户访问率、用户下单率是否提高等方式来做评价;在高质量训练语料构建方面,除了基于正则表达式进行数据清洗之外,是否可以用神经网络来自动生成清洗规则;在语言资源与技术共享方面,如何建立语言服务公司与机器翻译公司互利共赢的行业生态。

此外,大家还讨论了在机器翻译引擎构建方面,如何采用迁移学习技术、无监督及半监督的机器学习技术,进行资源稀缺性语言/垂直领域的机器翻译引擎研发;在机器翻译与高校翻译教育方面,如何破解“机器翻译与人工翻译”的迷局?人工译员真的需要担心失业么?

对于上述最后一个问题,阿里达摩院陈博兴博士表示,“机器翻译的量过去5年至少翻了两翻,但人工翻译的市场每年也保持了10%的增长速度。在不可逆转的全球化进程中,机器翻译和人工翻译都有大量的机会。对于译员而言,要不断提高自身翻译水平,也要学会利用机器翻译提高工作效率,否则,淘汰你的不是机器,而是那些会利用机器的同行。”

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2018-05-30
机器翻译技术发展与应用,将剑指何方?
随着跨语言海量信息快速交互需求的不断增加,机器翻译技术成为大数据翻译唯一可行解决方案,各种机器翻译应用层出不穷,目前全球每天机器翻译服务提供的在线翻译量已经达到了1万亿词的规模。

长按扫码 阅读全文