搜狗IoT产品总监李健涛:搜狗如何在AI翻译领域接连突破并成为行业第一?

谁是大数据赛道上的“最强大脑”?人工智能领域高端对话聚焦于哪些话题?一年一度的国家级博览会——贵阳数博会正如火如荼得举行。作为全球首个大数据主题的博览会,数博会已经成为权威的研讨平台,不仅云集了国内各大互联网公司、科技公司掌门人,来自全球的业界顶尖专家也应邀参会。搜狗IoT产品总监李健涛作为AI创新的翘楚,在数博会上进行了主题为《搜狗AI进击之路》的演讲,向全球的参会嘉宾展示了搜狗在AI翻译领域的前沿科技成果。

他表示,搜狗在搜索和输入法领域的业务已持续十三、四年的时间,拥有庞大的数据积淀,搜狗以“语言”为核心的AI布局具备强大的竞争力。搜狗的语音和图像识别技术的日趋成熟、从搜索到问答的变化、从输入法到对话的发展、以及搜狗在AI翻译领域的推陈出新,都代表着搜狗在AI领域的创新和“进击”。

做“语言”,搜狗比其他公司更专业

在演讲的开篇,搜狗IoT产品总监李健涛介绍道:搜狗是中国用户数第四大的互联网公司,搜狗输入法市场占有率多年蝉联第一,搜狗搜索引擎市场份额稳居第二位。他认为:“搜狗是中国搜索行业的挑战者,是AI领域的创新者。”搜狗输入法和搜索引擎十几年的积累,为搜狗在AI领域的发展,提供了大量的文字和语音数据支持,搜狗每日语音调用次数超3亿,峰值超3.6亿次以上,这些数据背景是其他公司所不具备的。

为什么数据对人工智能至关重要?李健涛对相关技术了如指掌:“对人工智能来说,有两个重要的影响,一个是算法,一个是数据。在算法方面,行业里面各家的差异并不大。但是人类需要通过数据训练机器,让机器懂得识别到底是什么处理机制。所以数据是很多人工智能公司能否产生重大技术突破的一个关键因素。”

所以,对搜狗的人工智能算法来说,多年积累的海量数据是得天独厚的深度学习资料,帮助AI在语音识别、图像识别、机器翻译等方面日渐趋于精准、接近真人水平。

李健涛介绍道:“搜狗整体人工智能布局围绕‘语言’展开。主要是两大方面——语言的两种载体,一种是语音,一种是图像。”

搜狗的AI语音技术,融合了语音识别、语义理解和语音合成三个密不可分的部分,将传统机器的识别和运算能力升级,成为了“更灵敏的耳朵”和“更聪明的大脑”。目前,搜狗语音识别准确率已达97%。

搜狗的图像识别技术同样不可小觑,它收集了数十万张图像进行系统训练,最终实现了80%的图像识别高准确率,可完成对犬类、花卉等类似图片的识别。更加“黑科技”的点在于,搜狗还实现了唇语的识别,支持10万+非特定人词汇量、口语测试集60%以上准确率,在车载或智能家居等垂直场景的命令集中,准确率超过90%以上。

此外,李健涛透露,搜狗输入法加入了“机器辅助对话”元素,具备词补全、智能回复、智能分享等多个实用功能;搜狗搜索也会向“问答”方向发展,搜狗问答机器人汪仔、搜狗答题助手、搜狗立知等产品就是“问答”的落地应用。

AI翻译在硬件上的施展机会更多

李健涛在AI翻译技术方面有着深入的了解:“在翻译方面,我们认为技术程度已经达到临界点,可以真正的大众民用化。” 搜狗独创的基于神经网络的机器翻译技术 ,实现了语音翻译、对话翻译、文字翻译、图像翻译等丰富的交互翻译方式,可完成61种语言互译。优秀的技术能力,也收获了市场的广泛认可,李健涛提到:“搜狗翻译相关产品日均翻译请求已超1.5亿次,覆盖全球超过1000万用户。” 在国际学术赛事WMT 2017中,搜狗机器翻译获得了人工评价指标的双向第一名。

基于神经网络机器翻译技术,搜狗输入法已上线翻译功能,用户可在聊天场景中进行中、英、日、韩等语言的翻译;搜狗搜索中上线了英文搜索频道,帮助用户用中文搜索全世界,现在还支持对日语、韩语信息的检索。此外,搜狗还上线了翻译App,在不同场景下进行声音、图片和文字的翻译;搜狗机器同传是全球首个商用机器同传,在达沃斯、世界互联网大会等百余场国际化会议中被广泛应用,同样也被本次数博会聘为同传指定服务商之一,为发言人和演讲者提供了准确的同传服务,获得了与会嘉宾的交口称赞。

李健涛着重介绍了搜狗旅行翻译宝和搜狗录音翻译笔,这两款智能硬件翻译产品,针对了不同的场景和群体。李健涛着重对它们进行了区分:搜狗旅行翻译宝首创离线翻译模式,翻译效果与在线效果持平,同时具备实景拍照翻译,“解决了不会说、听不懂、看不懂的痛点。”而搜狗录音翻译笔主要面向学生、记者和商务人士,不仅支持实时录音转文字,还可以完成同传翻译、对话翻译功能。“语音识别准确率超过97%,每分钟400字的转写速度, 支持分享给朋友和社交平台。”

最后,李健涛表示,搜狗的使命是让人们表达和获取信息更简单,“万物互联时代到来,搜狗在AI方面会继续探索,未来会不断将人工智能技术落地,真正做到民用化。”作为开拓者和领军者,搜狗还将为行业带来突破,为大众创造惊喜,让我们拭目以待。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2018-05-25
搜狗IoT产品总监李健涛:搜狗如何在AI翻译领域接连突破并成为行业第一?
谁是大数据赛道上的“最强大脑”?人工智能领域高端对话聚焦于哪些话题?一年一度的国家级博览会——贵阳数博会正如火如荼得举行。

长按扫码 阅读全文