语音识别作为人工智能发展最早、且率先商业化的技术,近几年来随着深度学习技术的突破,识别准确率大幅提升,带动了一波产业热潮。继科大讯飞、捷通华声之后,行业内又涌现出思必驰、云知声、出门问问、炬芯科技等后起之秀,在教育、客服、电信等传统行业之外,开辟出了车载、家居、医疗、智能硬件等语音技术应用新天地。与此同时,自然语言处理(NLP)作为人机交互技术的重要一环,也为此提供了助力。Siri的推出打开了语音交互的先河,不仅催生了一批语音语义创业公司,还激发了百度、搜狗等大型互联网公司在语音语义技术上的投入。
在AI快速发展的时代,语音识别技术已经陆续出现在生活日常电子产品中,如何智能芯片让机器听到且听准确人类的语言这将是一大难题。众所周知,生物识别靠人脸或指纹这类的技术都有稳定的特征,可是声纹就不稳定。一个浅显的比喻:人高兴的时候,第一天晚上唱了卡拉OK,第二天声音哑了,怎么能够在变化比较明显的生物特征上做识别是一个很大的挑战。语音识别整个过程包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。由于语音信号的多样性和复杂性,系统只能在一定限制条件下才能获得满意效果。在真实使用场景中,考虑到远场、方言、噪音、断句等问题,准确率会大打折扣。目前业内普遍宣称的97%识别准确率,更多的是人工测评结果,只在安静室内的进场识别中才能实现。
行业专家表示:想要让语音识别更加准确,需要解决两方面的问题。一方面,在语音增强、麦克风阵列以及说话人分离等多项技术领域持续投入,并结合后端语义,促进对上下文的理解,从而提升识别效果;另一方面,需要从产品设计上进行优化,比如通过进一步交互,使语音识别变得更为准确。在端侧主控芯片上来讲,应该研发出更高端的主控芯片,在声音前处理方面有更加优秀的表现,让拾音的距离和效率都能大幅提升。国内AI芯片主力供应商炬芯科技作为领先的声音前处理技术代表,凭借其20余年对声音研究的经验,曾推出的智能音频和智能机器人芯片备受国内外知名品牌商的青睐,且一直坚持对声音领域的不断投入和研究,坚持通过技术更好地捕捉声音,降低干扰,让有效的声音信息传送至智能机器的“耳朵”。
ATS3605(D)就是炬芯近两年一直在主推的智能语音平台,此芯片的语音前处理算法非常强大,尤其在降噪方面有非常好的表现。ATS3605(D)在相关平台上整合了语音前处理算法、本地语音识别、唤醒、VAD等终端语音的核心算法,对接阿里/Baidu后台,支持LCD显示,支持摄像头,并提供完整的智能语音解决方案。目前应用到的领域包括智能儿童机器人,智能音箱,智能家居中控等产品上,行业口碑甚佳。
通过深耕垂直领域和细分赛道,实现自我造血和快速成长,任何一家公司有机会在这一新兴产业中逐渐做大。接下来,随着语音识别和NLP技术的逐步成熟,智能汽车、智能家居、智能机器人产业的日渐完善,定会有一批优秀的技术类公司在智能语音产业的浪潮中顺势而起。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- GitLab将告别中国区用户:是时候选择新的“极狐”或保护账号了
- 苹果明年推至少22款新品,阿里非洲首站启动,科技新品盛宴拉开帷幕
- SUSE预测:未来私有AI平台崛起,让我们共同见证AI的未来
- AI伴侣“小奇”:奇富科技重塑金融服务体验的探索之作
- 揭秘软银孙正义神秘芯片计划:打造超越NVIDIA的未来科技新星
- 大模型创企星辰资本获数亿融资,腾讯启明等巨头入局,人工智能新篇章开启
- 大模型独角兽阶跃星辰融资新动态:数亿美金B轮,揭秘星辰未来之路
- 哪吒汽车创始人资金遭冻结,1986万元股权风波引关注
- 本田与日产酝酿合并:明年6月敲定协议,新公司社长待本田推荐
- 金融大模型新突破:百川智能Baichuan4-Finance引领行业,准确率领先GPT-4近20%,变革金融业未来
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。