抖音上线地方方言自动翻译功能,让用户“听”懂更多方言

为了让众多以地方方言为载体的区域历史、文化和习俗可以以短视频的形式制作、传播与保存,解决地方方言难以被更多用户阅读和理解的障碍。近期,抖音正式上线了地方方言自动翻译功能。创作者可以使用该功能,“一键”将粤语、闽语、吴语、西南官话、中原官话等方言视频转化出普通话字幕,方便公众观看。

随着短视频的不断普及,越来越多以地方方言为载体的视频出现在了短视频平台。这些极具地方特色的视频,一方面让广大用户欣赏到了山南海北不同区域的口音与特色腔调;另一方面,也因为方言识别的天然障碍,使其难以更好得被深度了解和传播。

为此,抖音近期正式上线了地方方言自动翻译功能。创作者可在抖音投稿主界面点击“拍摄上传投稿”,上传视频后,使用“自动字幕”功能,选择“转为普通话字幕”,新功能即可完成对视频内容的方言语音自动识别,并将视频里的方言内容转化成普通话字幕。目前,新功能第一期已经上线,支持粤语、闽语、吴语(上海)、西南官话(四川)、中原官话(陕西、河南)等,未来还将支持更多方言转化。

据悉,由于各地方言常以口语形式流传,可用于模型训练的方言语料数据较少,对方言识别和翻译都提出了很大挑战。对此,来自火山引擎的技术团队采用了自研的自监督预训练模型和多语言翻译模型,实现了极少量标注数据条件下识别方言的能力,且训练效率提升一倍,有效有效提升了多语言翻译的性能,同时大幅降低了模型训练的资源消耗。“基于日常服务抖音集团业务的技术积累,抖音方言字幕可实现超低延时和高准确率”,其团队负责人表示。

全国汉语方言学会副会长兼秘书长刘祥柏认为,普通话是我们国家法定通用语言,普通话以汉语方言为基础,在形成过程中长期从方言中吸取养分,方言与普通话相辅相成,都是中华传统文化的重要载体。“方言就像古建筑,要保护勿强拆”。刘祥柏表示,首先,以方言为载体的“乡音”是“故乡的情感符号和情感纽带”;其次,熟练掌握方言,有利于学习、掌握古汉语,有利于把握方言与普通话的对应规律,熟练掌握普通话;第三,汉语方言是地方文化的语言载体,“各地民歌、民谣、民谚以及快板、鼓书、说唱等,依赖于方言才能具有押韵、谐音等效果,才可以体现其基本的声腔特色和地方韵味。”

抖音平台治理相关负责人表示,将持续用技术记录真实而美好的生活,未来会继续升级方言自动翻译功能,服务以方言为载体的各地文化传播。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )