上周,谷歌将Google Assistant下放到Android 6.0,而苹果的Siri、微软的Cortana、亚马逊的Alexa最近也动作频频,一场围绕下智能语音助手的大战正在全面展开。
西雅图艾伦人工智能研究所CEO Oren Etzioni表示,Siri作为最早入场的选手,其语音理解和回答问题的能力并不突出,白白浪费了先发优势。
但Siri并不是一无是处,它仍然有其他语音助手目前无法匹敌的优势:支持36个国家的21种本地语言。由于大多数的智能手机都是在非英语国家销售,对本地语言的支持将是非常重要的一个能力。
相比之下,微软的Cortana能够识别13个国家的8种语言,Google Aissitant则支持4种语言,而亚马逊的Alexa目前只支持英语和德语。
但是Siri并没有停下,据外媒报道,iOS 10.3即将支持上海话。
如果语音助手想要成为智能手机和其他智能设备标配的工具,那么语言问题将是其必须克服的障碍。但是语言本身对任何助手来说都是复杂的。比如在英国,当谈论足球比分时,“2:0”要说成“two-nil”,而不是“two-nothing”。
苹果语音团队负责人Alex Acero在接受路透社采访时解释了如何教Siri学习一门全新的语言。
Alex Acero说,在苹果公司,当研究人员开始教Siri一门新的语言时,会让真人用各种方言和口音来阅读文本段落,然后由听译人员转录成文本,这样计算机就可以拥有准确的样本用来练习。此外,苹果还会从不同的声音中捕捉各种语音。然后,苹果会建立起一个声学模型,并通过这个模型开始尝试预测字符序列。
Acero称,苹果随后会在新语言中部署“听写模式”,这是一种文本和语音之间的翻译器。当用户使用听写模式时,苹果会捕获音频录音中的一小部分,然后对其匿名处理。由于这些录音有背景噪音以及模糊不清的词语,将会由专人转录,这一过程可以将语音识别的错误率降低一半。
在收集了足够的数据,并让配音演员为新语言录制了声音之后,苹果就会向公众开放这一语言版本的Siri。不过,发布之初Siri只能回答苹果认为最常见的问题。发布之后,Siri将会从用户的实际问题中学习,并且会每两周更新一次,作出一些调整。
不过,智能助理Ozlo的创始人Chales Jolley表示,为语音助手撰写脚本无法做到规模化,“你不可能聘请足够多的作者为每一种语言撰写需要的脚本,你必须将答案综合起来。“他认为,这还需要多年的时间。
三星去年收购了“Siri之父”创建的人工智能公司Viv Labs,这家初创公司就正在着手解决这个问题。Viv的联合创始人兼CEO Dag Kittlaus说:“Viv旨在专门解决智能助理的规模化问题,要想跨过目前版本的功能局限,唯一的方法就是开放系统,让世界来教它们。“
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 中国工业机器人密度全球第三,每万名员工配有470个,领先德国和日本
- 华为折叠屏最新专利公布:打破传统集中架构布局,将首发搭载华为Mate X6
- 《财富》全球商界领袖影响力榜出炉:任正非王传福雷军入选,马斯克排第一
- 周鸿祎“叫板”李彦宏:大模型幻觉是不可消除的
- Q3全球云计算支出820亿美元,亚马逊谷歌微软三家占比64%
- 用AI辅助砍价,淘宝上线“去谈价”功能
- 全球首个5G-A立体智慧网在京发布:5G-A生效比超85%,峰值速率11.2Gbps
- 美国室温超导闹剧主谋被解聘,此前多篇论文被指歪曲数据
- 李彦宏称百度第六代无人车RT6达到L4,成本已降至每台25万元
- 全国排名第一!江苏5G行业虚拟专网数达6454个,制造业占比45.7%
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。