为何专注语音识别的科大讯飞会成为AI领先者?

对于文字工作者而言,如何将演讲者/被采访人的语音转化为文字是一个痛点、一个刚需。求助于速录员是一个不错的选择,尤其是那些专业领域的速录员,比如在科技行业,不懂AI或者VR等专业名词的速录员很容易在速记中闹出笑话。

在今年9月份锤子手机的发布会上,锤子科技产品总监朱萧木秀了一段语音识别,这也让科大讯飞的语音识别技术一下子增加了众多“锤粉”。借助语音识别,原本需要一点点聆听的语音可以转变成快速阅读的文字,这无疑是文字工作者的一大福利;但似乎也是速录员这一职业的终结者。

在著名资讯公司麦肯锡最新发布的一项全球研究发现,约45%的工作可以实现自动化,这将影响到60%的岗位,其中三分之一的工作将被机器人替代。但与此同时,麦肯锡也安慰人们,技术变革往往需要几十年的时间才能被整个社会广泛接纳,人们还有时间去慢慢适应。

不过,语音识别并非替代速录员那么简单,与人们在过去用文字触达虚拟世界的方式不同;未来,人们只需要通过语音就可以实现与虚拟世界的连接。因此,专注于语音识别的科大讯飞更有机会成为未来人工智能大爆发时代的领先者。

人类正在从文字时代进入语音时代

计算机出现以来,人们与计算机之间的交互几乎都是通过文字来实现。即便是代码阶段,某种程度上也可以看作是文字的交互方式;如今,语音正在替代文字。对此,“互联网女皇”玛丽· 米克( Mary Meeker )认为,语音应该是最有效的计算输入形式。因为对于消费者,语音可以快速沟通、简单方便、个性化并且无需键盘。

有统计数据显示,机器对语音识别的正确率从2010年的约70%,提高到2016年的约90%。从这样的速度看,语音时代可以说已经到来,未来人们与智能终端的交互方式除了传统的键盘文字输入,语音将逐渐成为新的主流。

语音技术时代的开启,所带来的不仅仅是输入的革命。在科大讯飞轮值总裁胡郁看来,语音技术将带来7个层面的变革:1、输入法,2、语音转文字,3、翻译,4、智能家居,5、自动驾驶,6、机器人,7、教育。

严格来说,在不同的领域,语音技术都是基础所在,是语音技术在这些领域的应用所带来的变革,每一个领域都不容小觑。以机器人为例,语音将一改计算机时代的键盘录入,成为人机互动的主流方式,这里所说的机器人不止是我们常见的人形机器人,很多时候,“系统”也可以称之为机器人,而且不同的应用场景可以诞生出不同类型的机器人,它们都能够深入应用到语音技术。

在不久的将来,IOT充分普及后,人们无需再通过手机这样的智能终端与整个世界连接,只需要借助手表、纽扣等,你只需告诉他们:我想去吃饭,附近有什么好吃的?你就可以迅速获得回复,机器会告诉你附近有哪些好吃的地方,距离多远,有没有优惠或者排队人数多少的等信息。当你确定去哪里时,系统会告诉你如何到达那里,需要多少时间,并为你安排预约甚至是提前点菜等等。

不过,我们也大可不必担心语音会完全替代文字作为主要的输入方式,毕竟有很多的应用场景里并不适合语音输入,比如在公共场所,每个人都在与机器互相交流、自言自语,这样的场面也是蛮怪异的。

科大讯飞打算成为怎样的领先者?

严格来说,语音技术在未来的人工智能时代更像是一种基础技术,单纯推动技术的发展和应用,最终很有可能只是为其他企业做嫁衣。如何在语音技术的基础上孵化出更多的产品和应用,才是像科大讯飞这样的企业最大限度挖掘人工智能潜能的关键。

为此,日前科大讯飞基于“讯飞超脑”人工智能最新技术发布了一系列新品,包括万物互联输入解决方案、讯飞听见多语种翻译、智能家居、智能服务机器人、智能车机、个性化语音合成、智慧教育等技术产品,更多是从科大讯飞人工智能技术在社会生活的创新应用出发。

在翻译领域,科大讯飞的中英互译神器——“晓译翻译机”,可以快速、准确地实现了中英口语的即时互译,并支持汉维互译功能,未来科大讯飞还将为之增加更多语种,实现不同语言之间的便捷交流。

在汽车领域,科大讯飞的汽车智能车载系统——飞鱼助理,则将远场识别、全双工、多轮交互、方言识别等技术应用于汽车,可以在复杂的行车环境中轻松进行通讯、导航操作,收听了解多媒体娱乐信息,对车身进行控制和信息查询等服务。

在智能机器人领域,科大讯飞的智能客服机器人——晓曼,更是集合了科大讯飞的语音合成、语音识别、语义理解和人脸识别等多种技术,结合麦克风阵列、3D摄像头、身份证读卡器、取号小票机等外设应用,以语音、触屏、动作等多模态的交互方式为用户服务。

在智能家居领域,科大讯飞的超脑魔盒打造了一个通过语音便捷控制家居设备的智能环境;而在教育领域,科大讯飞通过学业数据采集和教学过程性数据分析,实现多维度教学发展性评价和基于知识点的学生个性化学习。

从以上种种可以看出,科大讯飞的野心是以语音技术这一基础技术作为切入点,由此衍生出更多的产品和应用出来,在帮助人们视线智能生活的同时,谋求更大的市场空间。这也正是科大讯飞所倡导的“人工智能+”,严格来说应该叫“语音技术+”。

不管怎样,科大讯飞都在一定程度上掌握了语音技术的“核心科技”,正如科大讯飞董事长刘庆峰所说,在人工智能时代,各细分领域的创业英雄更容易成功,只要你有创意、有品位、有感觉,能够精准满足每一个人的个性化需求,你就再也不用担心被别人的数据入口和资金瞬间血洗出场。

本文为科技新媒体“常言道”(微信公众号:changyandao1)出品,作者丁常彦。原创作品,欢迎转载,转载或引用请注明作者及来源。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2016-11-25
为何专注语音识别的科大讯飞会成为AI领先者?
语音识别并非替代速录员那么简单,与人们在过去用文字触达虚拟世界的方式不同;未来,人们只需要通过语音就可以实现与虚拟世界的连接。

长按扫码 阅读全文