5月27日晚,深圳卫视的《超级发布会》直播现场迎来了天猫精灵“炫AI生活”的主题发布会。除了戚薇、王铮亮等一众明星的星光熠熠,会上发布的智能机顶盒产品“天猫魔盒”更夺人眼球。
发布会上,戚薇吃掉了“遥控器”,天猫魔盒更厉害,吃掉了所有的遥控器,动动嘴,科技生活,开口即来。
图为天猫魔盒发布会现场
作为阿里天猫精灵背后的语音交互技术提供商,今天声智科技就带您一起揭秘“智能机顶盒”产品背后的语音交互逻辑。
准备好了吗?你家的机顶盒要升级了!
“人工智能语音点播”这个概念在机顶盒市场已经不新鲜了,无论是网络机顶盒,还是4K高清电视机顶盒。然而,各家玩转的概念还是离不开“遥控器”。
遥控器控制语音点播一直是不少用户吐槽的槽点:
“为什么不能直接语音点播?”
“如果我都已经拿到遥控器,我一键就可以看我的欧冠决赛,干嘛还要蛋疼的说一句,然后默默等待...”
用户对于更自然的人机交互方式的真实追求,成为了机顶盒智能化升级源源不断的动力。机顶盒远场语音交互的能力提升也是源于语音智能服务落地并向智慧家庭迈进的进一步诉求。毕竟,以遥控器为代表的传统智能电视交互方式承载能力有限,而远场语音控制不但让人与电视的交互变得更加简单自然,还可以更大释放智能电视的操作空间。
如何快速实现智能机顶盒一站式升级?
如何牢牢把握住语音交互时代的机遇,快速实现电视机顶盒一站式升级?下面,专注声学前沿技术和人工智能交互的“声智科技”就带您一探究竟智能机顶盒升级,那些不可不说的秘密武器。
1.麦克风阵列
电视作为大尺寸显示设备,用户的使用距离较远,而且客厅的环境较复杂,并且机顶盒是距离电视最近的外置设备,电视播放过程中的声音也会对机顶盒造成不小的影响,因此实现天猫魔盒的“释放双手,炫AI生活”自然离不开远场语音交互技术,而提到远场语音交互技术首先提到的一定是麦克风阵列技术。
麦克风阵列的主要作用是帮助机器适应更加复杂的场景,摆脱遥控器的局限,也就是不再是用户去适应设备,而是机器来配合人类的交互习惯。这其中,麦克风阵列起到了关键性作用。
麦克风阵列是由一定数目的声学传感器组成,用来对声场的空间特性进行采样并处理的系统,通常麦克风阵包含2个以上的麦克风。此次,新款天猫魔盒搭载的就是6麦环型阵列。
图为声智科技麦克风阵列模组
麦克风阵列的关键技术包含了通话降噪、混响抑制、回声抵消、噪声抑制、语音增强、波束形成、增益控制、识别优化等。
目前,声智科技为智能机顶盒市场打造了定制优化的低功耗麦克风阵列芯片,并针对客户的智能电视、智能机顶盒等产品的不同市场定位推出了量产验证且成本可控的2麦、3麦、4麦、6麦,线型、环型、菱型等阵型的麦克风阵列模组,帮助用户快速升级产品,量产落地。
2.机顶盒专属远场语音唤醒、识别等技术
与智能音箱不同的是,智能音箱是一款单品,无需适配其他第三方硬件产品,单一的音频信号,简单、清晰的交互逻辑。但是机顶盒产品不仅增加了视频播放的功能,还需要适配不同品牌、不同机型的电视,而且多维度的交互场景使得语音交互过程复杂、多变,技术难度系数更大。
声智科技推出的SoundAI Voice Kit(以下简称SVK)针对智能机顶盒产品使用场景定制了以OpenAEC技术、VAN技术为代表的专属技术。
SVK是一款集成声波配网、波束形成、声源测向、定向拾音、噪声抑制、混响消除、回声消除、语音唤醒、端点检测、语音识别、语义理解、语音合成、双工通话等全链路的智能语音交互开发套件,兼容主流智能语音硬件架构,支持DuerOS、AliGenies、小爱平台、腾讯叮当、Amazon Alexa等主流AI平台, 助力品牌厂商实现智能硬件产品的极速开发和量产上市。
图为声智科技SVK介绍
OpenAEC技术主要解决弱参考信号或者无参考信号等更为复杂场景的回声抵消(自噪声抑制)问题,是SVK针对智能机顶盒产品的交互特点而推出的。一款智能音箱上市,其喇叭的参数及特性,以及智能音箱输出的音频参考信号是已知且较为准确的,工程师可以针对其特点,有的放矢的进行自噪声抑制和远场信号处理,从而实现很好的远场语音交互体验效果。
图为智能音箱与智能机顶盒场景对比
但智能机顶盒需要匹配不同品牌、机型的电视产品。而众多品牌、机型的电视机其喇叭参数特性千差万别,不仅如此,电视机厂商打造的绚烂音效,如立体声、环绕声等,也为智能机顶盒的信号处理带来了极大的阻碍,加上电视机回传给机顶盒的音频参考信号的不准确性,使得机顶盒的自噪声抑制和远场信号处理的难度急剧增加。声智科技通过创新性的OpengAEC技术独辟蹊径,大幅提升远场语音唤醒的准确率,实现全方向的精准唤醒,并减少无序唤醒干扰,兼顾误唤醒率。
除此之外,SVK针对智能机顶盒产品,推出了抗强噪唤醒技术(AKS技术)、垂直抗强噪识别技术(VAN技术)、空间感知技术(SSP)和空间认知技术(SSA)等,其中的VAN技术也是智能机顶盒场景不可或缺的独特技术。
常见的居家环境下,电视一般挂在墙上,智能机顶盒放置在电视旁边或者前方。这时候噪声源、语音源与智能机顶盒的位置很特别,智能机顶盒的麦克风阵列距离电视喇叭发出的噪音源很近,当电视音量很大的时候,保证智能机顶盒的识别精准度就非常困难。针对这样的交互情况,声智科技推出了垂直抗强噪识别技术,专门匹配相应场景,为您带来更出色的远场交互体验。
声智科技结合国内智能机顶盒的发展趋势和用户需求,颠覆了传统机顶盒的交互方式,真正实现了人机之间的自然语音交互服务。在领先的麦克风阵列、唤醒、识别等技术之上,配合96%以上准确率的垂直领域深度语义解析以及行业领先的多轮交互能力、服务稳定性维持在99.9%以上,使用户可以抛开遥控器,自由体验AI炫生活。
多场景,全覆盖,体验丰富的语音交互未来
机顶盒从单一功能逐步发展成一种“复合型”产品,声智科技可以帮助机顶盒产品扩展更多功能,比如点播节目、播放音乐、查询天气、控制播放、搜索信息等,实现从内容、控制、游戏、服务的全覆盖,丰富用户的使用体验。
游戏娱乐是智能机顶盒最直接也最多频次的需求,声智科技的SVK可以赋予产品放音乐、听故事、讲笑话、播新闻、玩游戏的功能,另外还针对儿童的需求比如成语解释、儿童算术、唐诗宋词等需求进行了丰富完善。
服务和控制功能使得机顶盒成为家庭各终端的交汇点,成为智能家居的重要入口。用户可以语音询问机顶盒百科内容、找手机、设闹钟、查热量、充话费、查快递等,还可以控制家电等。
作为国内服务用户最多、应用场景最全和覆盖地域最广的远场语音交互技术供应商。声智科技一直以来致力于为广播电视行业产业链提供便捷、可靠的技术服务,为用户带去全新语音交互体验。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。