语音趋势会成为智能手机新卖点吗?

很久以前,比尔盖茨便曾经预言,语音交互将会成为未来人机交互技术三大主要方向之一。不管是从自然性、便捷性还是学习成本来说,语言都是进行信息传达最好的方式之一。只不过在过去,语言仅限于人与人之间的交流,而现在我们则希望通过自然语言做到和机器交流。不管是科幻小说还是为数众多的影视作品,都会经常出现人通过语音对设备进行操控的场景,内里则蕴含着人类对语音交互潜在的感情。

导演们负责将人类对语音交互的期许在影视作品中实现,而科学家则致力于将这项技术从电影带到现实生活中来。不管是国内还是国外,针对自然语言的识别、理解,以及将自然语言识别理解和设备交互结合方面的学习和研究从未停止过。早在2011年,苹果便推出了语音识别助手Siri,开启了移动智能设备语音交互的先河。与此同时,如Google、微软等科技巨头也纷纷开展自身对语音识别和自然语义理解的研究工作,分别推出了Google Now和Cortana,而国内的百度、搜狗、科大讯飞等企业也在进行同样的工作。即便专注于设计的Facebook近期也是通过收购Wit.ai的方式进入了这一领域。如今,语音技术俨然成为了科技行业的热门话题,也被誉为是下一次人机交互的突破口之一。

从使用场景来看,语音交互可发挥作用的地方特别多,如文字输入、实时翻译、人机交互等。不管软件还是硬件,都可以将语音作为一个信息输入源,并且将其变成次要或者主要的输入、交互方式。在现实应用中,我们看到如各大主流输入法工具都具备了语音输入的功能,而在智能家居行业中,如何通过自然语音操控家电产品的话题也为大众所津津乐道。而自Siri推出后,语音助手更是成为主流中高端旗舰智能手机的标准配置。

尽管语音交互已经在不同的业界得到了较为广泛的应用,但不得不承认的是,语音交互目前还远未成为人机交互的主流应用方式,盖因目前主流的语音助手尚存在一些”短板“:

1、特别依赖基础网络的建设

语音识别和自然语义理解,都依赖庞大的语料库及强大的运算能力,但语音交互的应用多见于不管是存储和运算能力都极其有限的移动智能设备,因此目前主流的解决方案多用云技术,也就是将语音进行压缩及特征提炼,将压缩提炼后的内容上传到云端,在云端进行识别和理解,然后再将识别理解结果返回。但这种解决方案也带来一个问题,对移动网络的带宽和网速有一定的要求。在基础网络建设未达到要求以前,要么识别速度慢,要么干脆无法识别,极大程度限制了语音交互技术的普及。

随着国内外移动网络的提速和覆盖,特别是4G/5G网络的铺设,目前基础网络对语音识别的限制已经越来越小。

2、应用方式有限,沦为玩具

目前智能手机上主流的语音交互工具,大部分仅限于少数几个功能,远未达到能够对人们正常使用智能手机需求功能覆盖的程度。即便以Siri为例,也仅是能够进行诸如播放音乐、打电话、打开特定应用程序等少数几个功能,且在使用上要通过物理触控的方式先打开语音助手,才能进行接下来的操作,并未达到语音交互”解放双手“的终极目标,甚至从某种程度来说是更麻烦了。

因此在现实中看到的情况是Siri等语音助手更多的是成为人们的玩具,并未达到取代传统操控方式的目的。如果想要达到这样的程度,必须将语音交互技术和手机的操作系统进行深层次的整合,能够直接在系统层面,以语音的方式对大部分功能进行直接操控。

3、识别准确度、深度、连续性不够

尽管已经可以做到对简单语言的识别和理解,但目前的语音技术在自然语义理解上面还存在很大的提升空间,甚至连基本的识别准确度仍然和人类存在较大的差距。这些同样决定了只能用语音对设备进行一些简单的操作,一旦涉及到复杂、连续性的操控,语音交互就无能为力了,只能回归到传统的操控方式,这种”间断使用“也会极大程度降低语音交互的体验程度。

但我们也要看到随着人工智能、神经网络、云计算等先进技术的快速发展,目前的语音识别能力和对自然语义的理解能力每天都在快速发展,使语音交互的应用场景不断得到扩充。在一些特殊的场合,比如开车时;或者一些特殊的人群,比如盲人,语音助手已经成为主要的人机交互方式,这些都代表着语音交互行业的发展情况。

语音交互是未来的趋势

不得不承认的是,触控仍然是现在时代环境下最佳的人机交互方式,但是也有其众多的缺点所在。在未来,语音交互必然会从目前的边缘性交互、辅助性交互成长为主流的交互方式,甚至成为最重要的人机交互方式。这有赖于基础网络、语音技术的发展,也有赖于以智能手机为代表的移动设备生产厂商不断的去探索语音和设备之间的关系。在这方面,传统的语音应用开发商具有天然的劣势,因为其只能基于设备支持的端口进行顶层开发。只有终端生产厂商才能真正做到基于底层硬件开始开发,做到深层次与语音交互技术的结合。因此未来语音交互的发展方向必然是众多相关机构联合,以产业联盟的方式进行推动,在这方面,国内的中兴已经在开始进行有益的探索,如其发起成立的智慧语音联盟便是将语音处理芯片商、语音识别软件商和搜索服务提供商、内容提供商等有效结合起来,并且结合中科院等强大的研究机构,推动智慧语音的规模化应用和普及。在2015年CES上,中兴新推出的主打语音交互的手机星星2号荣获大会最受欢迎十大手机之一,或许正代表国际主流对语音交互技术的认可。

于此同时,Google、苹果等智能手机行业巨头同样在推动语音交互技术的深度发展,如Google在著名工程师Johan Schalkwyk带领下进行语音识别和人工智能方面的研究,期望在2年内推出具有突破性的语音设备。而苹果每年同样投入巨资,希望Siri和iPhone进行更深度的整合。

从本质上来说,人类习惯于用语音进行交流,代表人类百万年来最自然、最习惯的沟通方式。一旦这种沟通方式在人类和设备之间的篱笆被打破,或许便会是智能设备下一个春天的到来。语音交互的大势已经慢慢造就,最终将如同现在的触控技术一样,真正融入到每一个人的生活中,如水,如空气。

作者大南,公众号:daxiaov

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2015-01-16
语音趋势会成为智能手机新卖点吗?
很久以前,比尔盖茨便曾经预言,语音交互将会成为未来人机交互技术三大主要方向之一。不管是从自然性、便捷性还是学习成本来说,语言都是进

长按扫码 阅读全文