2020 年 12 月 31 日,实时互动云服务商声网Agora 公布 2020 年度总结,集中展现了过去一年的业务进展和取得的成绩。2020 年,凭借在技术、产品、应用场景上的领先成果,声网实现了对实时互动行业实践的创新与引领,以及对 RTE 生态的持续赋能。
数据显示,声网 2020 年实时音视频分钟数月均用量超 400 亿分钟(按流计时约为 1600 亿分钟)、成立以来累计实时音视频分钟数超 10,000 亿分钟(按流计时约为 40000 亿分钟)、客户主动调用 API 次数突破 100 亿次/日、全球注册应用已经超 21 万(截至 2020 年 6 月底)。
01新技术落地
基于 AI 的美声、音效与降噪
在音频方面,声网Agora 今年推出了业界首个基于 AI 的实时美声方案。该方案适用于包括语音通话、互动直播、语聊房、桌游狼人杀等语聊场景,以及互动直播、K歌房、线上KTV、FM 电台等歌唱场景。
同时,在以上场景中,声网还提供了变声音效、曲风音效、空间塑造、电音音效四种实时音效。开发者均可通过修改接口参数调整人声、音乐的音效效果。
声网自成立以来,一直深耕于音频算法设计与落地,针对传统降噪的无法很好处理突发噪声的痛点,我们自研了基于深度学习的语音降噪模型 RFCAE(Residual Fully Convolutional Auto Encoder),并在今年依据此模型完成了实时降噪方案的落地。
图:带噪语料、WebRTC降噪语料及AI降噪语料对比
多算法落地 优化视频高清质量与体验
在视频层面,我们始终关注视频质量与互动体验。我们结合人工智能算法,同时利用先进的编码技术和传输算法,整体优化了 SD-RTN™ 传输策略和 Last Mile 传输策略,尤其针对东南亚、印度、印尼和埃及等地区进行网络优化,进一步降低首帧出图时间和切频道出图时间,并且有效提升码流爬升速度,优化用户体验。
同时,我们结合 AI 算法落地了专为 RTE 场景打造的感知技术套件 APAS(Agora Perception Augment Suit),将采集、前处理、编码、传输、抗弱网、渲染作为一个整体,通过多种自研算法来优化音视频端到端的处理。
图:APAS 感知技术套件
自研新传输协议
在网络传输层,声网自研了基于 UDP 的多路复用传输协议 AUT(Agora Universal UDP-based Transport Protocol)。该协议满足以下技术要求:
通用性:使用一套协议设计来满足不同场景的需求,不仅 RTC,也包括可靠数据通道;
传输协议中原生的流支持:多路复用,灵活的优先级管理,通过流中捎带自定义的 Stream Meta 信息,给使用者进行流的管理决策;
灵活的拥塞控制模块接口,可扩展实现不同的拥塞控制算法;
底层网络接口化,能够支持 SD-RTN™、UDP Socket 和任何虚拟网络等。
AUT 协议在 Agora RTC SDK 中作为底层传输技术已经得到了技术验证,为上层应用提供了高质量的传输保证和灵活的控制机制。
除此之外,我们还有多项自研技术在今年分别在中国、欧洲、美国获得了专利。
02新产品发布
行业首个体验质量标准 XLA 将“黑盒”明晰化
今年7月,声网基于近万亿分钟的用户体验数据及海量用户主观体验评价,定义并推出了实时互动行业首个体验质量标准 XLA,这是业内首个围绕用户实际体验建立的可量化、可查证、可赔付的体验质量标准和保证。XLA 相当于是把原本黑盒状态的体验质量明晰化了,一经推出就得到众多开发者及客户的认可,截至 10 月 24 日,已有 60 家企业加入 XLA 计划,将共同推动实时互动全行业体验质量的有效提升,推动实时互动行业逐渐走向成熟。
首创轻互动直播产品“极速直播”
声网极速直播开创了低延时、强同步的"轻互动"直播场景,并支持连麦。极速直播主要面向对文字、白板等消息互动的延时要求较高,或强弱互动频繁切换的直播场景,主播与观众端延时在 1.5s-2s 之间,相比传统 CDN 直播方案延时降低 80%以上,同时直播间内 90% 的观众与观众间延时差异小于 500ms,可满足电商直播、教育大班课、直播答题等观众需要强同步场景的需求。
低码高清:同等画质降低 50% 视频码率
基于传统的视频编解码方案,降低视频码率势必要以牺牲画质为代价,而声网基于对视频编解码多年的技术积累和深度理解,推出了低码高清产品服务,针对 CDN 直播场景,可以在保证主观画质不变的情况下,降低 50% 视频码率,帮助直播平台有效降低成本。声网低码高清通过融合 PVC(感知视频编码)、智能码控、ROI(感兴趣区域视频编码)等多种 AI 和深度学习算法,在服务端对实时媒体流进行转码处理,可实现同等画质下,大幅降低 CDN 直播视频码率,节省带宽成本。
03产品与质量改进
SD-RTN™ 传输质量优化 稳定性达到专线水平
首先,在实时数据传输质量的优化上,SD-RTN™ 的传输稳定性已达到专线水平,在包到达率上,SD-RTN™ 与专线已无差别,jitter 200ms 的到达率为 99.9%。
东南亚、中东地区的网络传输质量优化始终是目前行业的难点之一。我们在今年针对菲律宾等东南亚地区的网络质量进行了专项优化。目前,90% 端到端双向延时降低了14%,音频优质传输率达97.31%。
另外,通过对音视频、弱网、传输等层面的优化,在印度地区仅 Web 浏览器端的 5 秒登录成功率也提升了8%,并且成功支持多次万人大频道直播活动落地。
在中东地区,客户通过声网Agora 的 Cloud Proxy,进一步提升了该地区用户的网络接入成功率。
RTC SDK 优化落地,质量进一步提升
我们今年对声网Agora RTC SDK 进行了深度的架构优化,实现了类似于 Rust 和 C++20的无栈协程架构,简化了异步逻辑开发难度,提升有“异步化逻辑”需求的研发效率。在包体积方面,目前的 SDK 体积相较于原来更小,而且提供了灵活的剪裁包体积的能力,这在行业中也是独有的。
声网Agora 视频/音频 SDK 现已更新至 3.2 版。在迭代的过程中,我们也不断地对其背后的抗弱网指标进行着优化,目前视频的抗弱网边界已经从原来的 60% 提升至 70%,音频则已经提升至 80%,在这样的弱网环境下,仍可以保证音频、视频的流畅体验。同时,根据美洲,亚洲,东南亚,中东等地区用户提供的数据显示,SDK 首帧出图、出声时间也得到了全面的优化,客户闭环验证结果与实验室测试结果完全吻合。
同时,稳定性监控系统落地上线,对稳定性问题可做到提前发现、崩溃问题定级、自动提交 JIRA,可使问题快速进入处理流程,大大提高了问题修复效率。
Web SDK 4.x 版落地 极大提升开发效率和体验
面向 Web 浏览器端的Agora 视频/音频 SDK 在今年完成了一次优化。目前最新版(4.x)的 Web SDK 采用了 Promise (async/await)异步方法,可以极大地提升开发者的开发效率和开发体验。
TypeScript 可以帮助开发者写出高质量、高可维护性的代码,对于大型的前端应用开发具有非常重要的意义。Agora Web SDK 4.x 版使用 TypeScript 开发,所以也导出了完备的类型定义文件供 TypeScript 开发者使用,配合编辑器的 TypeScript 插件,这将会极大得提升你的开发体验。
实时消息 RTM SDK 弱网对抗能力提升
实时互动从来都不仅仅是指音视频的互动,还包括消息与信令控制等实时消息的交互。实时消息 RTM SDK 在今年已经开始支持富媒体消息的实时互动,支持传输 30MB 以内的图片或文件,并支持离线保存 7 天。
实时消息的传输同样需要低延时与高可靠。所以我们今年特别针对传输通道进行了优化。现在,RTM 在 Native 端的多种弱网情况下,消息到达率和实时性有大幅提升,在70%的丢包下到达率 100%。根据用户数据反馈,RTM SDK 全球全网实际端到端平均延时<150ms<>。
RTM SDK 目前已经支持 RESTful API、Unity 平台,以及小程序平台。
实时码流加速 RTSA SDK ,推两大子产品
实时码流加速 RTSA SDK 在今年完成升级优化后,发布了两个子产品 RTSA Lite 与 RTSA Pro,适用于不同的场景。
其中 RTSA Lite 面向资源有限的轻量级设备,拥有极小包体、超低功耗、低延时、抗弱网等特性,适用场景主要包含智能手表、智能摄像头、智能音箱等穿戴式、便携式的智能设备。RTSA Lite 覆盖平台主要有 Linux 全平台以及 RTOS 平台,它也是业内首个支持 RTOS 平台的实时互动 SDK。
RTSA Pro 则面向体验优先、资源丰富的设备,覆盖 Linux、Android、Windows 等平台,适用场景为无人车、无人机、智能机器人等。
RTSA 把编解码的灵活性释放给设备端,支持客户充分利用硬件的优势进行自定义码流。在传输层,RTSA 继承 SD-RTN™,运用全球全网节点 、智能动态路由以及端侧弱网对抗算法,提供高联通性、低延时、高稳定性的音视频码流传输云服务,配合低延时,高可靠的信令通道,助力开发者在任意设备与场景中开启实时互动能力。
水晶球大频道监测优化,取消人数限制
水晶球(Agora Analytics)是声网推出的行业首个实时音视频互动质量监测与分析工具,支持问题调查、数据洞察、实时数据、自动诊断。用户可以通过水晶球提供的丢包率、音视频接通、卡顿、网络连接状态等实时数据,快速分析定位质量问题。我们在今年优化更新了“大频道”功能,从原先只支持 100 人以上,现在最新版本已经取消该限制。
持续推进全球合规:数据传输,安全可靠
随着业务的全球化,声网将安全合规问题作为公司发展的重要战略方向,主动遵守业务覆盖国家和地区以及行业的各项法律法规,遵循最小化及公开透明的数据采集、处理原则,充分满足信息安全、数据安全及个人隐私保护规范。今年,声网获得了 ISO27001、ISO27017、ISO27018、SOC2 Type1 认证,通过了第三方 GDPR,CCPA,HIPPA 符合性检测/审计,进一步证明了严格的安全实践。
同时,为支持传输层加密,声网Agora 视频/音频 SDK 从 3.2 版开始新增 TLS(Transport Layer Security)加密和 UDP(User Datagram Protocol)加密方式。希望通过这一系列合规的动作,更好的保护全球开发者和客户的信息安全、数据安全及个人隐私。
04更多创新场景方案落地
视频面试:见证牛客网的200万场视频面试
声网为国内众多主流招聘平台提供了高质量、高并发、超低延时的实时互动解决方案,并有效保障了视频面试过程中稳定、流畅的互动体验。以牛客网为例,牛客网是国内知名的面向 IT、技术求职者的招聘平台,受疫情影响,今年牛客网平台“视频面试”的需求实现了爆发式增长,截止目前,牛客网今年单年的面试总时长已超过 8000 万分钟,同比 2019 增长了 5 倍,同时牛客网已为超过 100 万候选人服务了近 200 万场视频面试。
智能手表:轻量级设备专属的视频通话SDK
声网为小天才等多个国内主流儿童手表品牌提供儿童手表视频通话解决方案,在儿童手表场景中,保障每一位孩子与父母进行高质量、低功耗、低延时的实时互动交流。声网为小天才全系列儿童手表提供了轻量级设备专属的视频通话 SDK,包括了低功耗版本安卓 SDK 和全球首个适配 RTOS 系统的 RTC SDK。
智能作业灯:远程即可辅导孩子的作业
声网推出智能作业灯解决方案,为国内多家知名智能作业台灯提供实时音视频技术支撑,帮助家长和老师通过实时音视频随时随地对孩子进行远程看护、伴读与线上作业辅导。针对智能台灯不同的系统,声网都有对应的 SDK 支持孩子与家长的实时互动,并支持 iOS、Android、Web、Windows、macOS、小程序等 20+开发平台和框架,可以全面保障实时音视频在各类终端平台上的良好应用。
Watch Party:见证Scener疫情期间100倍增长
Scener是一家虚拟电影院平台,先后与 Netflix,Prime Video,HBO Max,迪士尼+,Hulu,Vimeo 等流媒体平台达成了合作。今年 3 月以来,Scener的用户用量增长了100 倍,Scener在 Netflix 上的收视率增长了 15 倍。声网为Scener的“ Watch Party ”功能提供了稳定、可靠的实时互动解决方案,见证了Scener今年疫情期间的 100 倍增长。
太空杀:增加玩家沉浸感、社交感
今年多家游戏平台推出了“太空杀”小游戏,一时间受到众多用户追捧。《太空杀》与“玩吧”平台使用了由声网提供的实时游戏语音技术,实现了游戏内置实时语音。声网拥有全球领先的实时游戏语音解决方案,通过在游戏内接入实时音视频,增加玩家沉浸感、社交感,同时声网还与游戏引擎商 Cocos、Unity 深度整合,Agora 音视频 SDK 已经上线 Unity asset store ,并集成于 Cocos creator,方便开发者快速在游戏中加入实时音视频功能。
云监考:实时监控考试画面并与考生视频通话
今年 5 月,声网与优巡达成合作,为优巡 App 的 AI 云监考提供实时音视频互动技术服务,通过声网的视频通话 SDK,优巡可实现监考人员在考试过程中,实时监控画面并与考生视频通话。不仅让远程监考更加高效、便捷,同时还保障了监考人员和考生沟通时的互动体验。除此之外,声网的实时录制 SDK 帮助优巡实现监考视频全程录制,作为留存凭证,方便监考人员在考试结束后对监考视频内容的快速审查和调取。
05开发者体验
开源 Demo 与 API Example
目前声网官方维护的Github有三个,它们包括:
AgoraIO,提供了一些基础的代码示例,以及一部分由官方维护的面向跨平台、第三方框架的 SDK 版本。
AgoraIO-Community,有来自社区开发者开发的一些 Demo,以及基于不同语言或框架开发的 SDK 等。
AgoraIO-Usecase,主要包含了一些成熟的场景 Demo。
随着实时互动场景的增加,以及产品不断新增的功能,示例代码越来越多,变得既不便于开发者查找,也不利于维护。所以我们在AgoraIO仓库中,上线了APIExample项目,包含了所有基础功能、单一场景的示例代码,比如一对一视频通话、一对一语音通话等。
另外,我们今年针对几个成熟场景开源了功能相对完善的官方 Demo,其中一些 Demo 也可直接通过 App Store 下载体验,比如 Agora Voice、Agora Live、Agora Meeting 等。开发者们可以访问Github获取源码:
https://github.com/AgoraIO-Usecase
跨平台、多语言支持
多年来,跨平台开发一直都是最重要的技术趋势之一。从 React Native 到现在由 Google 力推的 Flutter,框架年年革新,但热度从未降低。采用跨平台开发技术让软件开发者几乎可以用同一套代码就为不同平台构建应用程序,节省了时间、人力,以及不必要的工作。
在跨平台开发支持上,声网可能是最激进的实时互动云服务。我们目前已支持多种语言、跨平台框架,以及游戏开发引擎,包括:Cocos2d-x、Cocos Creator、Electron、Flutter、Python、React Native、Rust、Unity、Unreal、UWP。
另外,还有一波支持其它语言或跨平台框架的 SDK 正在路上,希望可以进一步加速、简化开发者的实现实时互动的多种场景。
文档细化,体验升级
仅仅提供 Demo 还是不够的,毕竟很多接口参数都需要查看文档来了解。今年我们通过为 10 余个平台/框架添加零基础跑通 Demo 文档,新增场景、最佳实践、术语等新类型的文档,帮助不同水平的开发者更好地使用 SDK。
同时,声网文档中心在 11 月份进行了改版,全面优化 UI 的同时,通过添加产品首页、API 专区、平台选择等,提升用户体验。
开发疑难,及时解决
疫情之下,我们与开发者的很多交流与互动,也从线下搬到了线上。
大家一定都知道 rtcdeveloper.com 这个域名,这是我们最初的社区。开发者与声网工程师们的很多对话都发生在这里。去年有来自开发者的1700多个问题都是在这里被解答的。另外一些上升至工单的问题,也都在平均 15 个小时之内被解决。
另外,我们在今年上线了“声网开发者社区页面”(dev.agora.io)。这里有我们长期举办的 Agora Talk、参加今年 RTE 2020 创新挑战赛春季赛、秋季赛的项目回顾、征文大赛的文章等内容,让开发者们可以了解更多音视频技术知识、开发经验,以及 SDK 的使用方法。
06声网年度大事件
成功登陆纳斯达克 股票代码“API ”
今年 6 月 26 日,声网成功登陆美国纳斯达克, 股票代码为“API ”,成为“全球实时互动云第一股”,当日以 50.6 亿美元(相当于 357.3 亿人民币)市值成为上海市值前十的互联网公司。成功登陆纳斯达克,不仅是资本市场对声网的认可,更重要的是,声网通过产品、技术、服务的专业性获得开发者和客户的认可。作为一家公众公司,声网财报的透明和公开,也可给全球开发者、客户更多的信心和保障。
RTE2020 实时互联网大会 中、美两地圆满落幕
由声网主办的「RTE2020 实时互联网大会」通过线上、线下相结合的形式于今年 10 月在中、美两地相继召开。今年的实时互联网大会由“ RTC 大会 ”更名为“RTE(Real-Time Engagement)大会”。全面升级后的 RTE 大会除了依然保留开发者们最爱的“ RTC 技术专场”,还覆盖了实时互联网的行业观察、生态建设、创业创新等各领域内容交流,打造了一个为实时互联网行业开发者、创业者、从业者、上下游生态合作伙伴创造价值并持续赋能的全方位大会。今年,共有 8000+ 开发者、行业人士报名参会,也有来自全球 100+ 互联网企业和组织机构的 170+ 重量级技术、行业演讲人在大会上分享干货。
发布云市场 2.0 打造更开放、便捷RTE生态
在今年的RTE大会上,声网发布了全新的Agora 云市场 2.0,通过整合全球 50 多家合作伙伴的能力,上线合作伙伴入驻云市场和开发者线上采购自服务体系,为全球开发者构建实时互动全场景一站式集成体验,打造更开放、更便捷的实时互联网生态。
RTE 2020 实时互联网创业挑战赛圆满落幕
今年7月,声网与五源资本(原晨兴资本)、奇绩创坛联合启动的“RTE 2020 实时互联网创业挑战赛”,成为全球首个实时互联网创业挑战赛,旨在全球范围内寻找“使用实时互动技术进行创新”的企业和场景。经过为期3个月的激烈角逐,来自虚拟社交领域的 Oasis、声乐教学领域的vipSing、以及协同办公领域的Notta三家企业,从 100+报名参赛的优质企业中脱颖而出,斩获大赛前三名。
RTE 2020 创新挑战赛圆满落幕
RTE 2020 Innovation Challenge 创新挑战赛,是由声网和 RTC 开发者社区联合举办,面向全球开发者发起的数据算法及创新应用类挑战。我们的初衷是挖掘对 RTC 领域感兴趣,热爱技术创新,且希望不断挑战自我的开发者,一起决定 RTC 的技术边界。本届大赛共分为 2 个赛季、4 个赛道,由 1000+参赛选手组成团队,提交了 100+ 参赛作品。
疫情还未过去,我们还是要逆水行舟,更进一步。2020 充满了复杂及不确定性。面对不完美的世界,我们能做的就是在这个过程中,保持思考,淬炼力量,获得成长。希望 2021 能与大家一路前行,尊重开发者的价值,释放技术的力量,一起拓展实时互动的边界。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )