自从百度把人工智能当做核心发展战略之后,这方面的进展也是神速。
3 月 13 日,百度宣布推出一款名为SwiftScribe的网页版应用,它能够利用人工智能技术把语音文件进行转录,感兴趣的可以去试试看。
长期以来,人们在转录语音文件时,常常需要通过手动逐字录入。但是SwiftScribe这款应用通过集成百度自主研发的语音识别技术以及功能简单的编辑工具,可以帮助人们实现语音文件快速、便捷的转录,提高生产效率。
据百度介绍,SwiftScribe 依托的核心技术来自百度的新一代深度语音识别系统—— Deep Speech 2。通过利用长达数千小时的标注语音数据进行“训练”,Deep Speech 2可以不断“学习”从语音中识别特定的字或词。
(图片来自:Networked India)
此外,百度还通过直觉快捷键以及人机交互技术来解决语音录入的不连贯问题。
对于那些职业速录师来说,SwiftScribe 能成为他们的生产力利器。对于一段时长为一小时的语音文件来说,常规情况下需要 4-6 小时去进行人工转录,并且每分钟的转录成本约合 1 美元。如果使用 SwiftScribe 的话,所用时间能缩短差不多 40%。
不过,虽然人工智能可以提高生产力,短时间内还没办法完全取代人类。在 SwiftScribe 完成初步的语音转录后,还需要人工去检查大小写、标点符号、错别字等等。
据百度的项目经理吴甜介绍,SwiftScribe 目前仅支持一小时以内的语音文件转录,但团队还在对应用的功能进行进一步开发,以后可能会增加对视频文件的语音识别、支持更多文件格式以及自动添加标点符号等功能。
从第一代的 Deep Speech 到第二代的 Deep Speech 2,百度已经在深度语音识别技术上深耕多年。2016 年,百度推出了使用 Deep Speech 系统的 TalkType,为 Android 键盘添加语音录入功能。同年,百度的深度语音识别系统 Deep Speech 2 还入选了美国《麻省理工评论》的 2016 年十大突破技术。
(百度 TalkType,图片来自:VentureBeat)
如今,包括亚马逊、苹果、Google 和微软在内的多家互联网巨头都在布局语音识别技术领域,国内的科大讯飞、搜狗等企业也都在语音识别领域有所建树。
百度首席科学家吴恩达曾表示:
我认为语音识别技术已经发展到了非常可靠的程度,使用的时候甚至都不用去想它。最好的科技往往是看不见的,而语音识别正在变得更加可靠,我希望它能够退居幕后。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 华为折叠屏最新专利公布:打破传统集中架构布局,将首发搭载华为Mate X6
- 《财富》全球商界领袖影响力榜出炉:任正非王传福雷军入选,马斯克排第一
- 周鸿祎“叫板”李彦宏:大模型幻觉是不可消除的
- Q3全球云计算支出820亿美元,亚马逊谷歌微软三家占比64%
- 用AI辅助砍价,淘宝上线“去谈价”功能
- 全球首个5G-A立体智慧网在京发布:5G-A生效比超85%,峰值速率11.2Gbps
- 美国室温超导闹剧主谋被解聘,此前多篇论文被指歪曲数据
- 李彦宏称百度第六代无人车RT6达到L4,成本已降至每台25万元
- 全国排名第一!江苏5G行业虚拟专网数达6454个,制造业占比45.7%
- Q3国内耳机电商销量排座次,苹果第一华为第二小米第六
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。