原标题:5G跟音频,有关系吗?
“5G来了,你最盼望的应用是什么?”
如果拿这个问题去询问大部分手机用户,相信收获的答案会是高清直播、VR、云游戏等等。应该近乎没人会说,“5G来了,会让我听音乐更爽”。
确实,5G提高带宽降低时延,基本指向于网络能够支撑更好画质,于是无论视频、游戏还是AR、VR,都把5G牢牢和视觉困在了一起。
那么5G网络的升级,真的就跟听觉一点关系都没有吗?换言之,今天智能手机以及个人硬件里,关于“听”的那一部分是不是已经走到了尽头?
其实未必,5G虽然与视觉紧密相关,但它能给声音带来的东西也不算少数。今天我们从几个方向展示一下,5G对音频的赋能到底是怎么发生的。
高音质与低时延:5G特性下的声音
首先能够给声音带来改变的,依旧是5G的基础特性:大带宽与低时延。
沿着这两条轨迹,我们会发现现有声音传输还是有较大空间来进行优化。在4G网络环境下,我们习惯了随时在线收听音乐、音频节目,甚至观看直播,但其基本是建立在音质经过较大幅度压缩基础上的。而当网络传输速率达到10Gbps左右的时候,高清音质也可以通过网络快速传输,保证实时化共享。另一方面,5G网络的低时延特性也给声音带来了新的可能,比如多声源同步问题可以得到比较妥善的解决。
把这些5G特性落到应用场景里,我们可以比较简单地看到,三个方面的5G+声音能力将被打开。随之而来是一些新玩法可能被挖掘。
一、高清、高品质音乐的在线化。
我们知道,一些高质量音乐在手机段很难复现,一方面是由于扬声环境有限,另一方面也是因为网络环境限制,导致质量较大的音频文件很难传输。5G直接带来的改变,是高品质音乐和音频节目具有更高的实现性。这个特性可能打开的应用,不仅于音乐一项。很多对于音质细节具有高要求的音频内容,比如环境音、催眠音效、白噪音等等也可以获得更好的输出效果。比如用声音来触发大脑舒适感的ASMR,一直以来其圈内都强调专用收音设备的等级。而高等级收音同时也需要大带宽网络的辅助,才能最终让用户体验到最终效果,5G到来或许是类似领域的一个契机。
二、让声音在5G中互动。
5G的另一个特性是低时延,这意味着不同音源的声音可以更好组成统一体。这一点应用在在线音频中,可以很好解决几个终端同步收音合奏的效果。今天的直播界,也经常会搞一些对唱和声之类的玩法,但质量很难跟现场音乐相提并论。尤其乐器合奏,近乎于是无法在4G网络环境下达成很好效果的。
5G网络的特性,可以让异地音乐排练变为可能。而对商业形态的最直接影响在于,5G网络或许可以让不同地域的歌手乐手完成高品质的合奏玩法,换言之就是网上音乐会成为可能。在今天直播与音频节目盛行的环境下,类似玩法应该会有比较好的表现。
三、更好的声画同步效果。
音频当然不止于自身,更多情况下它需要与视频合作。5G网络的低时延特性,一个可能性在于能够升级VR、游戏等环境下的声画同步体验,让声音更好与视觉配合。这个体验最直接的商业想象力在于互动视频,更复杂可交互的音效,是互动视频体验升级的核心路径之一。
声音漂移:IoT环境下无处不在的声音
更多时候,5G不能被看作一个单独的技术路径,而是必须与更多技术突破相结合,提供网络方面的助力。对于声音来说,这样的“5G+”赋能也同样存在。
比如我们知道,大量生活场景里的IoT设备,都趋向于取消按键和触屏,而是用智能语音交互作为主要控制入口。
这也意味着,大量家庭生活与车载场景里的IoT设备,都将携带发声设备。那么在5G环境下,这些设备将获得更好的联接效果与硬件虚拟化能力。声音也就可以在这些设备之间更好传输。
或许不久的未来,我们可以期待这样的场景:客厅中用电视追剧的你,要起身去运动,然后去厨房搞点吃的。在执行这个非常符合减肥需求的行动同时,你并不想停止追剧,至少也要听个声音。那么你可以把电视的声音扔到运动耳机上,运动之后再把耳机的声音扔到厨房的音箱,或者干脆扔到冰箱、燃气灶上……
IoT体系下的声音无缝体验,并不仅仅意味着用户可以指挥声音到处游走,同时也意味着设备对用户声音的识别、理解与交互能力。每个设备和用户说过什么话,学习到了什么东西,都需要体系化共享与再学习,这都需要建立在强大网络环境上。5G和wifi6,目前看来是这一能力的网络基础基石。
IoT必须拥有更多能力,而声音正是其中之一。
算法即声音:AI+5G赋能音频
或许关注AI领域的朋友有这样一个感觉,新闻里的AI语音能力越来越神奇,什么声音克隆、情绪识别、机器对话,都非常强力。但落到自己的手机和音箱上,总感觉有点傻傻的?
这里面有一个核心问题,就是算力和网络环境不达标,庞大的深度学习模型没法在现有条件下跑在终端设备上。虽然类似问题出现在机器视觉领域更多,但随着这两年语音模型飞速发展,算力和网络能力不足,优秀算法不能落到用户终端的问题,也开始出现在了语音领域。
所以5G给音频的赋能,另一个想象力在于跟AI结合。
未来,我们听见的机器声音和其他人传递过来的音频,很有可能已经经过了大量算法“美化”。声音界更具欺诈性的“乔碧萝殿下”可谓指日可待。
相对需要5G网络加持的语音算法应用,包括机器音的实时美化和情绪修饰、声音克隆、多模态语义理解等等。另一方面,在5G网络下,AI也将有条件更好理解用户的声音,并从中产生更多玩法和商业化价值。
5G即将到来,升级网络环境和众多新网络特性,对于各产业都将带来不同的升级效果。对于内容创作者来说,5G是新的画板。无论你的创作载体是声音、视频、游戏,或者想象中的其他形式,5G都是一个新的机遇。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 美媒聚焦比亚迪“副业”:电子代工助力苹果,下个大计划瞄准AI机器人
- 微信零钱通新政策:银行卡转入资金提现免手续费引热议
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与深度整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。