跨越AI大门,一本翻译蓝皮书、一场人机共译比赛投射出怎样的未来?

大语言模型LLM是这几个月热度最高的全球明星。目前看来,AI逐渐走向复杂专业的白领型岗位,已经是必然的趋势。

OpenAI刚刚发布的35页论文中,提到了最容易受到LLM影响的职业中译员和笔译员排名第二。

以前机器翻译就是出国旅游时拍拍路标、看看菜谱,现在GPT-4连学术论文里的复杂长难句、专业术语都能理解,“人肉翻译”越来越没优势。

生成式AI能直接模拟已故的翻译家,输出大师风格的译文,一般人做翻译还有什么前途?

调用ChatGPT翻译一本中等部头的英文书,只需要花大概十个小时、四美元,人工翻译卷到天际也达不到这样的性价比……

这段时间,外语专业学生和翻译从业者们有类似心情的人不在少数。

根据中国翻译协会的调查,中国的翻译人才的规模是538万人,其中本科以上的中青年为主,这些年轻、专业、高素质的人才如果离开了翻译行业,岂不可惜?

所以,我们应该尽快回答这些问题:AI时代,我们为什么还需要人工翻译?翻译人才要怎么跨入AI的大门?译者+机器的人机协作,有哪些必要条件?

幸好,翻译行业的反应速度远比我们想象得快。4月3日至4日,2023中国翻译协会年会举办,百度翻译联合中国外文局翻译院、中国翻译协会翻译技术委员会,共同发布了《2023机器翻译技术及产业应用蓝皮书》。

《蓝皮书》系统阐述了机器翻译的发展历程和方向,介绍了产业级机器翻译系统和产品形式,并通过实际案例展示了机器翻译产业应用现状,对机器翻译未来发展提出建议。为推动机器翻译技术与各行业的深度融合提供有益借鉴,为机器翻译技术的产业应用提供有力支持,其客观、全面、权威的信息,也成为翻译人才把握当下趋势的权威参考。

(《2023机器翻译技术及产业应用蓝皮书》视频简介)

同时,在译协年会上,由百度翻译提供技术和平台支持的“首届全国翻译技术大赛”正式启动,预计赛制持续到8月,也为中国翻译人才拥抱技术提供了竞技舞台和窗口期。

没有人会怀疑,我们正处在一个非常重要的历史转折点。面对大语言模型等最新AI技术带来的无数可能性,中国翻译人才可以不焦虑、不盲目、有底气的进入人机共译新阶段。

不焦虑:“见识过‘珍妮纺纱机’,我还是选择当翻译”

在翻译行业工作多年的小A表示:太阳底下无新事,翻译人见过的“AI威胁论”并不少。

2016年,翻译领域就曾出现过类似的“珍妮纺纱机时刻”。当时,一篇名为《翻译界的重大突破!作为一个翻译,此刻我理解了18世纪纺织工人看到蒸汽机时的忧虑和恐惧!》的文章,传遍了翻译人的朋友圈。

不少译员和外语系学生就像在手工棉纺织时代,看到了由蒸汽机带动的珍妮纺纱机,能同时纺8卷线一样,感到非常担忧。

原来,百度于2015年发布了全球首个互联网神经网络机器翻译系统。随后,谷歌、微软相继部署了以神经网络作为基础的机器翻译系统。这种机器翻译技术,通过建立深度神经网络模拟人类的翻译过程,在语言表示、语义理解、译文生成等方面有显著进步,让机器翻译的质量大幅提升。结果呢?今天人类翻译依然存在,而大众使用翻译服务的门槛则大大降低了。

更早一点,上世纪末的翻译人,也曾遇到过“珍妮纺纱机”。九十年代,统计机器翻译方法的出现,可以基于大规模语料自动训练模型参数,这种方式不需要人工专家来构建翻译规则,比基于规则的机器翻译效率更高、效果更好,弥补了当时国内高水平的专业翻译人才匮乏、不能满足实际需求的问题,让更多高质量的译著走出了国门,走进大众视野。

作为一种更古早的机器翻译技术,基于规则的机器翻译,其实也曾是人类眼中的“珍妮纺纱机”。上世纪五十年代,哪怕穷尽全球翻译家们一生的力量,也只能掌握几十种语言,译著只占人类作品总量的冰山一角,通过计算机自动完成翻译,解决全球沟通和交流的问题,也带来了翻译业态的快速发展。

把时间拉回到当下,以 ChatGPT、文心一言为代表的新一代预训练模型技术,通过超大规模的数据和充分训练实现了智能涌现效应,大幅提升了机器翻译的鲁棒性和容错能力。

所以说,机器翻译从来没有真正消灭人工翻译,这是历史上被多次证明的,反而机器翻译让高质量翻译人才的需求更加旺盛。

面对新的机器翻译技术,翻译人才对于“珍妮纺纱机”的恐惧,更多是源于对于自身发展的不确定。幸好,这种“不确定”正在被“国家队”所改变。

在刚刚发布的《2023机器翻译技术及产业应用蓝皮书》中,中国翻译协会的调研数据显示,有超过 85% 的受访者认为“机器翻译 + 译后编辑”的工作模式会在更大范围内应用。

《蓝皮书》认为,机器翻译成为人类译员的得力助手和有效补充,促使翻译行业催生出更多如译后编辑、机翻质量控制等新职业,正在多种场景中被应用。

简单举几例:

1.加速短视频、网络文学等中国优质内容出海。人人译视界助力 B 站的海外达人项目,完成三百多个频道的译制工作;晋江文学城、米读小说 APP使用针对网络文学垂直领域定制优化的机器翻译系统,将大量本土网络文学作品翻译成英语、西班牙语、葡萄牙语等语种,获得海外用户的青睐。

2.助力企业海外市场经营。中石化的企业智能翻译平台,支撑境外财务票据核销、重大项目审计、合规备案等翻译工作;新华社的“新华丝路”, 引入智能翻译平台,辅助人工译员提高翻译效率。

3.支撑各行各业数字化建设。译马网引入“AI+人工” 的译后编辑模式,日均翻译字数可提升近 4倍,翻译成本降低 34%;迈迪培尔开发的医药等垂直领域机器翻译,为科研人员的研究工作提供了极大便利。

总之,翻译领域的新机会还有很多,更详细的信息,大家可以在《蓝皮书》中阅览。

机器翻译大有用武之地,高端翻译人才也是时代所需。二者相辅相成,可以满足不同层次的翻译需求,在获取全球信息、对外交流等方面将发挥越来越重要的作用。

作为普通人,要做的是学习驾驭最新的“珍妮纺纱机”,把机器翻译用好,不是留恋做一个“手工纺纱人”。

不盲目:从朦胧到清晰的人机协作之路

那么,“AI+人工” 的译后编辑工作模式下,究竟怎样才算用好AI技术?人机共译,需要具备哪些技能?

《蓝皮书》提供了方法论,呼吁培养 “翻译 + 技术 +N”的精翻译、懂技术、能力强的新时代高端翻译人才。首届全国翻译技术大赛,则提供了具体的实现路径。

要将AI技术和机器翻译作为得力助手,人类译员想要提高技能,也不能盲目。

“首届全国翻译技术大赛”,由中国外文局、全国翻译专业学位研究生教育指导委员会指导,中国翻译协会、中国外文局翻译院、大连外国语大学主办。百度翻译作为承办单位之一,提供翻译技术与比赛平台支持。

从阵容中不难看到,赛事为推动行业各方对机器翻译技术的了解和应用,提供了清晰的方向和路径:

1.清晰的培养方向。

举办方是百度翻译,和翻译行业的“国家队”,保证了比赛涉及内容的前沿性和权威性,同时,赛事向各类翻译爱好者开放,高校学生、翻译机构、企业单位等都可以参与,人才覆盖面广。

由此证明,复合型翻译人才的培养,AI+翻译融合学科的建设,离不开政产学研用多方形成合力,提供更充沛的实践机会和更明确的方向引导。

2.清晰的技能标准。

中国的翻译人才要开启“人机共译”工作新范式,需要具备哪些核心能力?比赛考核点的设计,也给出了清晰的答案,让人才能够不再迷茫,提早培养自身的竞争力。

比如以往的翻译比赛,主要考察人类译文的准确性、优美性,而此次比赛,还将对机器翻译的掌握,纳入了考核,包括对机器翻译软件内置功能是否熟悉,操作熟练度如何,是否充分运用了技术,做到真正以赛促学,帮助大家掌握先进的机器翻译工具。

(译后编辑能力考察:术语替换题)

3.清晰的产业基石。

大赛由百度翻译提供技术和平台支持,背后也有着深度的考量:中国翻译综合能力的提高,要建立在怎样的机器翻译底座上?

选择百度翻译,一是技术领先,百度于2015年自主研发的全球首个互联网神经网络翻译系统,能够快速提高翻译产能,是较为先进的机器翻译工具。

二是平台能力,百度智能文档翻译平台的创新人机共译模式,将机器翻译(Machine Translation)+ 译后编辑(post-editing)+ 模型自学习相结合,让机器翻译结果越用越准,效率不断提升。

三是应用丰富。百度智能文档翻译平台,提供术语参考、翻译记忆、智能纠错等功能,内置权威术语,查证更省力,在工作中真正为人类译员减负。

从底层技术到上层应用的优势,是百度智能文档翻译平台“被选择”的原因,也为翻译行业和翻译人才接下来的发展提供牢靠的支持。

翻译人才如何跨入AI的大门,从首届全国翻译技术大赛开始,路径正从朦胧走向清晰。

(产业级机器翻译系统流程图)

有底气:从一群人的比赛,到全民的新可能

你可能会问:我又不当译员,机器翻译的发展跟我又有什么关系呢?

当然有。

从基于规则的机器翻译,到大语言模型驱动的机器翻译,机器翻译技术的每一次更迭,都会让全社会、全世界广泛受益。

你读到的一部译本,与海外朋友的一次对话,境外旅游时的无碍沟通,前沿论文的快速传播……翻译成本不断降低,以前需要请一个翻译,现在手机app/翻译笔就能搞定;体验越来越丝滑,原本要分段复制粘贴的学术论文,现在整个丢进百度智能文档翻译,就能直出全部译文,还带还原版式,阅读效率也高多了。

对于个人来说,跨语言沟通、学习和交流,是成长和进步的基础,通过百度翻译这样的智能产品获得更高质量、更低成本的翻译服务,减少了很多不必要的时间和操作,某种程度上来说,是一种人生的提速。

对于企业来说,产品出海或跨境贸易,需要在翻译上投入高成本,有时还不能快速到位,一些翻译相关业务场景需要定制化开发,缺乏相应的人才。

《蓝皮书》中提到国内某世界500强企业,需要通过海外媒体报道和电商渠道的消费者评论等信息,进行海外市场经营决策,涵盖近百种语言,每月翻译需求超百亿词,涵盖文本、文档、图片等多种形态,海量而冗杂的翻译任务,全靠人工根本没办法及时跟进最新市场动向。

中国企业要“走出去”,AI+机器翻译,是必不可少的辅助。

百度翻译从模型到应用的丰富能力,背靠百度生态,可与计算机视觉、语音处理等人工智能技术深度融合,全面、及时、深入响应不同行业不同场景的业务需求。

对国家来说,翻译能力是国家软实力的一部分。

中国外文局局长、中国翻译协会会长杜占元指出,国家翻译能力,是通过翻译行为建构对外话语、开展文化传播、塑造国家形象的综合能力,是文化软实力和国际传播能力的重要组成部分,也是发挥大国作用、提升国际话语权的重要保障。

从这个角度看,加强国家翻译能力建设,除了传统手段之外,机器翻译的技术领先性、安全性、可用性愈发重要。

百度在大模型技术、大语言模型(LLM)、自然语言处理(NLP)方面深耕多年的技术储备和领先实力,从芯片、深度学习框架到翻译模型的核心模块自研能力,让百度翻译有望成为首屈一指的产业级机器翻译系统,在翻译行业智能化、数字经济交流中发挥作用。

这些力量融合起来,才推动中国翻译来到新的转折点。而一个沟通无碍、高效的新世界,会让一个人、一个企业、乃至一个国家,都获得新的机会与可能。

1999年,万维网的发明者、互联网之父Tim Berners-Lee,就曾提出过一个概念:social machine(社会机器),即人与机器的协作体。人负责创造,而机器负责执行。当时,最热的机器是家用电脑,全国都兴起一股“电脑热”,各种电脑培训班、电脑操作书籍纷纷问世,和今天的“AI热”差不多。

如果你不会恐惧电脑、抗拒电脑,那当然也不应该恐惧AI。AI时代,我们仍然需要人类译者,语言的通天塔一天没有越过,翻译的火种便会生生不息。

个人对机器翻译的不同态度和选择,将迎来不同的命运,但愿你的选择,映射的是你的希望,而非恐惧。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-04-04
跨越AI大门,一本翻译蓝皮书、一场人机共译比赛投射出怎样的未来?
大语言模型LLM是这几个月热度最高的全球明星。目前看来,AI逐渐走向复杂专业的白领型岗位,已经是必然的趋势。 OpenAI刚刚发布的35页论文...

长按扫码 阅读全文