(原标题:IBM宣布语音识别错误率接近人类水平)
网易科技讯3月10日消息,据IBM官网报道,人们在说话时,对方每听20个单词都会漏掉或听错1-2个单词。在5分钟的对话中,可能会听错80个单词。但我们多数人在听懂说话上没有问题。然而,电脑就不一样了。
去年,IBM宣布在自然对话环境中的语音识别上取得重大成就:开发出单词错误率为6.9%的系统。此后,该公司不断取得进步。现在IBM宣布创造新的业界纪录:5.5%的错误率。这是对非常困难的语音识别任务:纪录人与人之间日常对话如“买汽车”,计算出来的结果。这种纪录的语料库被称为“SWITCHBOARD”,20多年来一直用于检验语音识别系统。
IBM研究人员在实现这个突破时,专注于应用深度学习技术,将LSTM(长短期记忆)和WaveNet语言模型与三个强大的声学模型结合起来。在被使用的3个声学模型中,前2个为双向6层LSTM,其中一个为多特征输入,另一个有对话多任务学习能力。最后一个模型有个独特的地方,其不仅能从积极的例子中学习,也能利用消极的例子,因此会变得越来越聪明,在重复出现类似说话风格时表现更好。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 特斯拉CEO马斯克身家暴涨,稳居全球首富宝座
- 阿里巴巴拟发行 26.5 亿美元和 170 亿人民币债券
- 腾讯音乐Q3持续稳健增长:总收入70.2亿元,付费用户数1.19亿
- 苹果Q4营收949亿美元同比增6%,在华营收微降
- 三星电子Q3营收79万亿韩元,营业利润受一次性成本影响下滑
- 赛力斯已向华为支付23亿,购买引望10%股权
- 格力电器三季度营收同比降超15%,净利润逆势增长
- 合合信息2024年前三季度业绩稳健:营收增长超21%,净利润增长超11%
- 台积电四季度营收有望再攀高峰,预计超260亿美元刷新纪录
- 韩国三星电子决定退出LED业务,市值蒸发超4600亿元
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。