极客网4月10日(北京)一个假期接着一个假期而来,出行订票时我们对着手机上的智能语音机器人说话,就能让它帮忙找到出行所需信息。如果不想走出去,在家里,我们对着智能语音电视说出想看什么,然后,我们只需要静静等待精彩节目的上演。还不止这些,我们的手表、我们的眼镜等都能通过语音理解我们的需求,智能语音控制大有成为智能硬件标配的趋势。
某一天,一个男人站在北京上地某办公室的落地窗前,内心起伏,想着这些智能语音给生活带来的改变,他脸上满是笑容,看着窗外渐绿的世界,他知道尽管春天已经来了,但冬天远未离去。智能语音的征途还很漫长,但景色还是要看的。
这个男人在向我们如此介绍智能语音带来的智慧生活同时,他感慨道:“智能语音会是下一个互联网入口,尤其在移动互联网时代,这个入口将更快形成。”
智能语音或是那个神秘入口
这个男人是雷臻,OKVoice的联合创始人,2014年8月,他和另外两位联合创始人决定要做一件厚积薄发的事情,说是厚积薄发,是因为他们有着五年左右的技术储备,这件事情就是现在的OKVoice。
OKVoice主要从事智能语音技术和人工智能探索,仔细想想这也算是一家比较老的公司了,加上创始团队五年左右的技术储备期,这家公司快6岁了。OKVoice联合创始人雷臻在接受硅谷网专访时,所表现出来的创业姿态和思路,对应这家公司后来者的身份,更是难以让人不好奇。当谈到争论和声音不断的“移动互联网入口”问题的时候,雷臻脸上浮现出了比以往更多的笑容,他表示,智能语音现在正站在风口等风来,它就是移动互联网入口。
资料显示,目前,国内外多家公司从事智能语音相关产品的研发和生产,国外主要以微软、谷歌、苹果、英特尔、IBM等巨头为代表,国内主要以百度、腾讯、盛大、搜狗、科大讯飞、云之声、OKVoice为代表,其中,科大讯飞、云之声、OKVioce一类公司是以智能语音为标签之一的垂直公司。
金矿是容易让人趋之若鹜的事物,智能语音,被称为互联网的下一个金矿,尤其是在这个移动互联网炙手可热的时期。此间,虽然智能语音更多时候仅是表现为新潮的人机交互方式,但智能语音市场早已开始布局备赛,你未唱罢,我便登台,抢占传说中的“入口”。
巨头公司纷纷涉足语音市场,加剧智能语音市场竞争的同时,抢滩“移动互联网入口”的目的越发清晰,在雷臻看来,智能语音市场的潜力现在仍被低估了,随着智能硬件的不断升级改造,未来智能语音市场是会被真的“智能硬件”引爆的。从巨头公司争相布局智能语音拉开“移动物联网入口”战备竞赛来看,未来几年,智能语音会上升到一个前所未有的战略地位,相应的智能语音市场,也会有一个明显的爆发现象。
渗透式改造行业才刚刚开始
让机器理解人的语言,是一个从语音到文本、从文本到理解的技术过程。由于中国方言和口语丰富多样,智能语音的准确率和理解率会偏低。面对这样的中国智能语音市场,国内外巨头必将面临更为残酷的竞争。雷臻和他所带领的Okvoice不愿错过抢滩中国智能语音市场的绝佳时机,但是雷臻认为,智能语音和行业的结合更有意义,更让大家心动的是,渗透式改造行业才刚刚开始。
所以,OKvoice除了针对中国方言和口语推出的“语音识别”服务外,还推出了“字幕服务、口语评测、智能客服”等特色服务。
其中,“字幕服务”就是典型的智能语音和行业深度整合的技术类产品,借助“字幕服务”,可以将影视作品、电视节目、在线课程、视频会议等视频中的声音,通过语音识别技术自动生成文字并导入生成字幕。雷臻告诉硅谷网,借助云计算和大数据,这项服务未来或可实现工具化的在线服务。非专业人士拍摄的小视频,通过这项在线服务,就能轻松制作出具有影视风格的短片。
据第三方数据不完全显示,OKVoice推出的“字幕服务”快速通过语音识别自动生成文字,目前阶段,准确率在垂直领域可达到95%,省时省力。当然还有提升空间,随着技术不断完善,更高的准确率下带来的便捷体验,对“字幕制作”这个行业小痛点,也算是莫大的安慰。
比以上这些更引人注目的,是智能语音与硬件的互动,在市场需求及技术和模式创新的驱动下,全球智能语音产业正在快速发展。像蓝牙耳机、车载导航、语音门禁等智能语音解决方案,都在逐步完善中。不得不承认,智能语音正在改变我们的生活。
随着智能终端设备的普及以及可穿戴设备、智能家居等发展,智能语音行业发展趋势见好。语音会是未来一种简单和常用的人机交互模式。特别是在场景化的环境中,如驾车,不方便通过手或者眼球操作,语音是一种首选的方式。受硬件形态的约束,市场上将会有更多的硬件引入智能语音的技术。
一次公开场合上,智能语音技术和人工智能探索者作为OKVoice的定位被进一步夯实,陆续上线的服务中就有我们前面提到的渗透式的行业解决方案。当然,这些解决方案,还有待市场和用户的进一步检验。
格局未定,后来者自我壁咚
“互联网+”的概念提出后,在不久前刚刚举办的2015博鳌论坛上,互联网领袖的关注度格外高涨。本次活动上,李彦宏、比尔盖茨、马斯克这三位大佬的对话更是引人瞩目,其中很多观点都蕴含着对未来的重要意义。其中,人工智能就是三位大佬在对话上都高度关注的领域,而众所周知的事情是,智能语音是人工智能的基础支持和核心要点。
这听起来很让人兴奋,虽然智能语音距离人工智能似乎还比较遥远,但是,越来越多的通道将被打开,在中国,越来越多的公司加入智能语音市场,百度宣布语音识别技术及能力全面开放,微信发布了语音识别开放平台……现阶段,互联网巨头都还只是在试水,还没有大规模地进入语音这块市场。大公司考虑更多的是自己的商业闭环,而垂直的公司更多做一些聚焦,前者进入语音市场是立足做一个平台级的产品,而后者更关注垂直与细分市场。
OKVoice也是这么做的,格局未定,后来者可发挥空间还很大。“巨头的参与让智能语音这个领域容易得到更多的关注,共同培育市场,市场对参与者反馈越多。”雷臻在说这句话的时候异常平静。
对雷臻来说,这是他的第二次创业了,第一次是做优惠券,就是现在O2O的雏形。第二次,他选择了智能语音这块大蛋糕。30多岁的雷臻,看起来干练自信,言谈举止亲切而自然。当年雷臻从华为出来的时候,他就坚信,创业这件事情,厚积薄发更能带来惊喜。
前面提到的OKVoice五年的技术储备,来源于团队构成的强大技术背景,但这还不够,应该还有这个团队共同的强大理想所架设的“极客”氛围。在OKVoice创业初期,公司还在研发“语音识别”的升级产品,一个主抓技术的同事因为家中有事,雷臻给了他一个星期的事假,其实,用7天来处理该技术的家事还是有点紧张的,结果,这个可爱的技术大牛只用了不到一半的时间就赶了回来,结果,该阶段项目进展提前完成,为后面“渗透性行业智能语音服务”节省出了竞争时间。
“这样的一个团队,是一个可以创造神奇的团队。”雷臻对来访者说,又像是在自言自语。言语当中自豪和压力都有,他对现在的OKVoice的估值是一亿美元,别人问他,你这么估值的依据是什么:是行业前景,是市场体量,还是技术储备?雷臻笑语,他说,我们不主动寻找资本介入,也不排斥资本介入,我这是在逼迫自己呀。
雷臻是一个紧跟潮流的人吗?像也不像,他似乎忘了一个潮词。这个潮词是“壁咚”。壁咚的字面意思是大力拍打墙壁发出“咚咚”声的行为,但分场合又有着不同的意义。通常是指恋爱中,男性把女性逼到墙边,单手或者靠在墙上发出“咚”的一声,让其完全无处可逃的动作。
现在的雷臻就像在谈一场恋爱,恋爱对象是“智能语音”,是“竞争对手”,是“行业未来”,但更多的是他自己。这和自恋无关,他做为后来者,究竟壁咚了谁?在智能语音风起云涌的当下,后来者雷臻壁咚的是自己。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。