2016年,互联网巨头都在秀人工智能的肌肉。继Google AlphaGo下棋赢得人类之后,今天百度又有一个人工智能应用曝光了:度秘实况解说NBA总决赛。据一位百度工程师朋友圈照片显示,在今天上午勇士对骑士的比赛中,度秘模拟人工解说员对比赛进行了实时讲解,同时提供新闻速递和经典回顾。除此之外,度秘还支持互动,能够回答关于比赛的各种问题,比如“库里得了多少分”。
这让我想到了不久之前在谷歌I/O大会上发布的Duo信息应用,这个应用使用了谷歌的人工智能技术,能智能回复信息,比如看到朋友发来的一张图片,它可以识别其中的物体,回复类似于“喔,这只小狗很可爱”这样的信息,还能根据信息内容推荐最适合的快捷回复词汇。度秘和谷歌Duo,都是基于人工智能的“聊天”应用,不同之处在于,度秘是面向NBA比赛的,智能化程度更高一些,它不只是识别某个句子,而是去理解整场比赛,像人一样进行专业解说。
度秘背后的原理是怎样的?据我观察,度秘暂时还未能做到直接看NBA视频来理解比赛,而是通过抓取各种相关的新闻资讯、网友聊天,来实现“实况解说”的,它能够回答用户问题,也是基于对文字的理解。可见,度秘背后最关键的技术,是自然语言处理技术,即NLP。
自然语言处理技术主要是语义理解,比语音识别更加复杂,背后需要以深度学习为基础的人工智能技术。自然语言处理技术是Siri等语音助手变得聪明好用的关键所在,用户说话习惯、断句方式、说话场景不同,背后往往有不同的意图,机器要理解并不容易。基于传统的规则算法是不可能穷举各种表达方式的,只有基于统计的深度学习才能不断提高语义理解的准确度。度秘的应用表明,自然语言处理技术不只是可以用来更好地理解用户的语言,还能更好地理解网络内容,并再次组织,形成以假乱真的“直播解说”。
百度的自然语言处理技术尤其是中文处理技术,经验还是比较丰富的。百度过去一直在做的就是解析用户自然语言形式的搜索请求,并在海量网络内容中寻求答案,而后者同样是自然语言形式。百度不断在尝试去理解人类的语言,以及不同的文字,另一个典型应用是百度翻译,它能够理解不同语言的文章,进行机器翻译,已经达到实用水平,获得国家科技进步二等奖。自然语言处理,一方面需要海量语料、词库的积累,为统计算法提供基础;另一方面,需要模拟神经网络的深度学习算法,这是一个被人类研究了几十年的技术,最近一年实现从量变到质变的突破,不论是AlphaGo还是度秘还是Siri,背后均是类似技术。
AlphaGo战胜人类之后,人工智能这一技术性概念,被全世界熟知,相关应用越来越多,谷歌Home、谷歌Duo、Amazon Alexa、Siri、度秘等等典型应用愈发被人们接受。不管是基于语音还是文字,这些应用的背后,均会用到一个关键技术“自然语言处理”,通过这个技术机器可以理解人类、与人类对话、还有学习世界上的文字去变得更聪明。
在今年百度联盟峰会上李彦宏的演讲主题是人工智能是“下一幕”,所展示的“智能识图”,需要机器去理解人类的问题;此前度秘还进入了上海KFC的一家餐厅,像服务员一样接收人类指令去订餐,这也用到了自然语言处理技术;之前传得很火的机器写稿,背后也是自然语言处理技术,将网络上的文字和数据再次组织起来,跟度秘做的事情很相似。
毫不夸张地说,没有自然语言处理,大部分人工智能应用形同虚设。
“度秘直播解说员”眼下还在内测,很可能会在今年奥运会期间对外开放,为大家解说不同的比赛。相对于传统解说员而言,度秘的解说在生动性上可能会有差距,著名的解说员如黄健翔、柯凡、杨毅们,都有自己的风格,引经据典、旁征博引,还有幽默之类的情感因素,机器短期内是做不到的。不过,机器的好处就是它不知疲倦,可为你解说每一场比赛,并且还能进行个性化定制,每个人都可拥有属于自己风格的解说员,解说员还可以随时回答你的问题。未来度秘与语音合成技术结合起来,就可以做林志玲版、范冰冰版或者你老婆版的比赛解说了,这会让比赛解说变得更加有趣。
除了解说比赛之外,度秘背后的自然语言处理技术,有着许多应用空间。这几年人工智能技术的发展实现了从量变到质变,相关应用将会成为实际,而不是停留在想象或概念阶段,具体来说,以下领域会因为自然语言处理技术的成熟而率先爆发:
1、家庭机器人:家庭机器人需要“能说、会听、会动”,会动就是能做饭倒茶拖地按摩,这一点,是机器人公司在做的事情;而“能说会听”就是人工智能的事情了,需要自然语言处理能力,在语音识别之后,去理解人类的命令,与人类对话。因此自然语言处理技术成熟之后,家庭机器人将会普及,尤其是陪聊类的,例如儿童、老人、单身男陪伴类的,你可以定制一个林志玲回家陪你聊天。
2、客服机器人:不论是电商系统的在线咨询,还是客服电话的在线咨询,现在的体验都很糟糕,主要是要排队等待,很多互联网公司的客服电话,能打进去算是中大奖了,但这些公司又不可能大幅扩张客服队伍,人力成本实在是太高了。有了人工智能的客服机器人,它就可以去理解用户的问题,文字、语音均可,并与用户进行对话,就像真人一样。这将大幅提升客服体验并节省人力成本。
3、助理式搜索:美国曾有一个“人工搜索”引擎,你提出一个问题,有专人去帮你找答案,需要付费。印度的justdial、中国移动12580以及中国电信114热线,同样是基于免费电话的搜索服务,背后有专员给你找答案。这样的搜索服务体验有好的地方,就是个性化的助理,可给你准确的答案或安排你的行程,不过使用成本太高,基于电话不够方便,又费时间又花钱,并未普及。现在自然语言技术成熟,其与搜索结合起来,就可给每个用户提供一个免费的私人搜索助理,基于文字或语音均可。
人工智能是一个很泛的概念,语音识别、图像识别、语义理解、自然语言处理、机器翻译诸多技术均可归为其中,自然语言处理技术则是人工智能普及的基础。在过去,它是人工智能普及最大的瓶颈,现在从谷歌、苹果和百度等公司的动作来看,这个瓶颈很快就被消除了。家庭机器人、客服机器人、助理式搜索、定制化解说,很快就会成为现实。
微博@互联网阿超 微信 罗超 (luochaotmt)
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 美媒聚焦比亚迪“副业”:电子代工助力苹果,下个大计划瞄准AI机器人
- 微信零钱通新政策:银行卡转入资金提现免手续费引热议
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与深度整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。