语音交互是智能手机等终端产品最便利的输入工具,从2011年iPhone 4s首次集成siri至今,语音交互应用历程仅仅走过三四年时间,但其价值和效应已经得到凸显。而随着目前3G、4G网络全面繁盛的状态,未来的语音交互将在生活、通讯、学习和工作中扮演更重要的角色。在未来,随着物联网、车联网等新兴技术的兴起,语音交互在声控命令、操作方式以及人工智能方面均有望产生更大的价值。
但语音交互在达到这个期望阶段的成长过程中,却也需要沉淀技术、语料库、语义理解等工作,并且语音交互作为相对单一且枯燥的工作,研究者能否在这条路上专注,这也决定了语音交互的未来发展结果。另外,从现在的情形来看,语音交互的发展与高速移动网络有关,因此未来能否为语音交互提供超越4G之上的移动网络,这也直接决定了语音交互的发展结果。
1、手机语音交互:siri开创先河
2011年,苹果公司发布新产品iPhone 4s,苹果首席执行官提姆.库克在发布会上重点讲述了其应用功能siri。之后,随着iPhone 4s发货量普及全球,这款有着中规中矩发声的语音助理软件也随之走向世界,并从此成为行业产品的示范。在这之后的数代苹果产品中,苹果公司都无一例外地内置了该款应用,并且使其通过语义学习而变得更加智能、便利和精确,今天的iPhone、iPad等苹果设备上,siri已经成为数以亿计普通用户查询生活信息的必备工具。
siri虽然只是一款普通的语音助理软件,但其却对后续的智能手机发展产生了重大的意义,这在它盛行后有大量的追随者相继涌现的现象便可一窥究竟。在产品价值上,siri解放了用户双手,让用户在操控智能手机的时候有更多选择,另外,siri的语音控制方式还能让用户在获取查询结果方面更便利。相对于所有的输入设备来说,语音交互的声控方式是一种进化,这种方式对于普通用户,正是一种全新的体验和尝试。
但siri的天生自豪之外,却是它的天生难堪——它成名于傲慢的苹果世家。
苹果公司拥有无与伦比的设计与产品体验优势,能为全世界的用户创造超越想像力之外的创新产品,但在siri身上,苹果公司并未让它的这些天赋在siri身上得到全面的绽放。因为,siri作为一款领先的智能语音交互工具,其诞生的早几年只在英语市场有着强烈应用频率,而在其他语种地区,siri的表现就不再出众。比如siri的中文语言,是在距离英文语言之后的很久时间后才得以推出,且早期时候的中文版siri并不精确。
siri这种顾此失彼的情况造就的结果,则使得大多非英语地区的市场迎来了全新的自我成长空间,在中国,科大讯飞旗下的讯飞语音、搜狗、百度等等公司在语音领域方面进行了进击和尝试。在目前的智能手机上,除了iPhone之外,国内的小米、魅族、中兴星星2号、OPPO等厂商均推出了各自的语音助手产品,只是大多厂商采取的是在科大讯飞的语音输入方式上集成自己的皮肤,而中兴等厂商则通过自主研发。
2、趋势:语音交互融合智能终端
iPhone之后,其他手机厂商纷纷介入语音助理领域,间接带动了其他智能终端设备的语音交互进程化。
这种趋势带来的结果是多方面的。一方面,大家争先恐后的涉足直接推动了语音交互的流行程度,但另一方面,不同厂家因为不同技术实力差异而导致的语音交互体验差距,也让不同消费者的感受是不一样的。这其中的主要缘由,在于大多厂商都是在基于第三方语音识别的基础上进行二次优化或开发,但大多开发者因为技术水平的不同,因此导致了最后真正做出有语音识别交互水准的往往都是大公司。
苹果公司早在推出siri的前6年就开始筹备相关项目,而中国本土最富盛名的语音识别公司科大讯飞,其业务本身就是一家专业处理语音识别技术的公司。而百度、搜狗等公司在语音识别方面的优势则在于大数据——它们依赖搜索引擎进行海量的语料库累积,这些语料库被当作为语音识别的参考资料库的情况下,其为用户提供的语音识别功能也即有了无可比拟的优势。
这种优势体现在产品身上的直接结果,便是消费者可以直接享用到天然的技术积累优势,但一些厂商却并不满意这样“站在”别人的技术肩膀上,而是通过自主研发方式进入这一领域。中兴在智能手机领域声势不如小米,但却发力语音交互,其最新的产品不仅可以让消费者通过语音控制完成拍照、应用开启及驾驶模式下的导航与音乐等生活娱乐功能,而且在语音技术的基础上还融入了体感技术,让语音操作在便捷的同时也更自然。
特斯拉广为人知的缘由是其属于电动车,但事实上,通过语音交互实现驾驶者更多需求的功能探索,目前也已经成为包括特斯拉在内的大多汽车厂商在研发的焦点。对于在行驶途中有额外交互需求的驾驶者来说,语音交互是最为合适和恰当的方式。在其他领域如医学、教育、精密仪器等等领域,语音交互的高效和便利一样适用。
诸如此类,这些依靠语音交互而实现体验更加便利的方式,正是时下智能手机正在践行着的事,而在其他终端领域,语音交互的应用实践也在一步一步地显现。未来的语音交互不仅仅只局限于智能手机,汽车、家庭娱乐中心、政府部门或是其他相关机构,都能借助语音交互方式实现人力成本的减少但工作效率的提升。
3、4G潮流:智能手机提携语音交互
语音交互在过去很长一段时间里并未受到重视,这是由当时的网络状况决定的,在过去的时代里,3G刚刚诞生、2G无力承担一切的情况下,再优秀的语音交互也无法施展全部风采。但在信息技术的浪潮下,4G时代的全面来临,给予了语音交互巨大的成长空间。正是在这种3G鼎盛、4G繁盛、虚拟运营商也接踵而出的背景下,移动网络的时代正全面到来。
智能手机上的语音交互应用可为用户提供信息查询、需求处理、生活服务处理等需求,因此基于高速的3G和4G网络,语音交互可以无障碍地实现生活、工作和学习的更高效率化。这种状况在过去需要依赖114等信息台帮助完成的情况,在今天却只需要消费者个人直接对智能手机说出需求即可。
当前的语音交互在使用与练习过程中,会通过不断的自我学习达到新的理解程度。在现有的大数据、云计算和人工智能日趋取得突破的前提下,语音交互借助3G、4G高速移动网络的时代已经全面来临。特别与智能手机形成相辅相成的方式,更让语音交互在未来更加细致地融入每个人的生活与学习。
而目前随着科大讯飞、中兴等在语音交互方面的发力,未来不久远的语音交互或许将迈上一个新的台阶。
4、语音交互挑战:急利于心or静炼修成
语音交互作为最适合当前智能终端使用的输入式方式,目前其作用已经得到应证,未来随着越来越多行业的加入和发展,其价值和商业效应还会得到更大的体现。在控制、传达、理解与协调等日常程序中,语音交互的便捷、易传达、高效、便利等特征将会带来事半功倍的效果。特别对于无法打字或知识文化水平有限的用户来说,语音交互的实质价值将影响更深远。
不过,语音交互作为一项需要深厚技术积累、海量的语料库积累而成的新型信息科学,需要以时间、优秀的精准人才,以及强有力的技术及硬件作为支撑,在经过周密而繁复的分析和计算之后,才能得到些许科学成果。这是一项枯燥且投入巨大的工作,没有充足的回报诱惑,很难在短期内获得成功。
正是在这样的情况下,一些急功近利的机构或个人无法保持科研的初心,依靠各种取巧方式试图走捷径。这种方法虽然于情于理都不会被容许,特别对于科研精神和科研态度而言,这种走捷径的方式虽然一直不耻于业界,但近年来仍有个别公司一直未放弃这种“努力”。
然而,所幸还有一些领先的语音交互研发公司保持了对技术的坚持,科大讯飞、中兴、百度、腾讯等等公司在这方面都已取得不错成绩;而在成果转化和落实方面,一些革新二代语音交互手机产品的问世,也已经为行业掀起热潮。随着这股潮流,未来的其他智能终端产品身上不再设置其他输入设备,而是通过各种语音交互方式,使得消费者用声控方式即可完成一切操控,这在目前看来已经不再遥远。
--完--
作者简介:朱翊,中国第一批blogger作者(11年blog写作经历)。知名意见领袖、互联网媒体人,逐一传媒公司创办者。长期关注互联网商业趋势与案例研究,涉猎TMT、移动互联网、电子商务、品牌传播与管理、家电数码等领域;目前从事公关、营销、品牌等管理工作。个人微信号:izhuyi;个人公众平台帐号扫描下图:
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与深度整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
- 特斯拉首次聘请品牌大使:韩国奥运射击选手金艺智
- 华为研发中心入驻上海青浦致小镇房租大涨,带动周边租房市场热潮
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。