声网发布aPaaS灵动会议 AI成为下一代视频会议的新方向

人阅读

2024-09-24 19:04:18

来源：TechWeb.com.cn
相关关键词
- 声网
- AI

9月24日消息，声网正式发布aPaaS “灵动会议”，该产品采用RTE Core 和 AI Core 的双引擎深度融合，能够灵活适配多种会议场景业务需求。

基于声网自研的AI Agent 框架，“灵动会议”能够兼容市场上主流的 ASR（自动语音识别）、LLM（大语言模型）和 TTS（文本转语音）技术，具备Workflow编排能力。尤其是声网的 AI 框架支持多模态大模型的集成，这意味着企业不仅可以使用单一模型（如语音识别模型），还可以将多模态的大模型能力（如图像、音频、文本处理等）融合到一起，满足更复杂的会议场景需求。

同时，通过“灵动会议”产品底层的AI框架，开发者可以高效地集成会前、会中、会后场景的多种 AI 功能，如AI会议纪要、实时翻译、AI助手等，满足实时互动和会议场景的需求。

开发者还能通过“灵动会议”的产品架构将这些 AI 功能独立对外赋能其他产品，这意味着企业不仅能在会议场景中实现智能化升级，还可以通过灵动会议的RTC 与 SIP 网关互通功能，应用于如 AI 电话客服等场景，大幅降低客服成本，提升运营效率。

在集成方式上，“灵动会议”采用aPaaS低代码设计，通过提供模块化的API、UI组件和即插即用的集成功能，使得开发者可以在较短的时间内完成集成，无需进行大量的底层开发。如果UI不能满足，“灵动会议”可提供多层次API接口与插件机制，支持基于SDK Core层和 RTE PaaS 层的定制，满足多场景需求。

“灵动会议”支持SFU+MCU 混合架构。“MCU 模块与 SFU 模块直接集成，抛弃了传统的网关架构，通过裸流通信技术，实现终端设备与云端的直接互通，解决了网关集成时的画质损失问题，并且混合架构支持 MCU 上的多个硬件终端与云端 SFU 的软终端之间的多画面灵活组合，用户可以自主选择多个视频流进行合成，不再局限于画中画模式。

此外，在部署方式上，“灵动会议”支持多种部署模式，包括私有化、混合云、公有云等，能够灵活适应企业的不同安全和合规要求。同时，“灵动会议”还支持混合云和公有云的无缝备份与切换，确保业务的连续性和数据的安全性。

会议系统正在经历从“信息通道”向“智能决策引擎”的转变，过去的会议系统只承担信息传递的功能，而如今，AI 赋能为会议提供了更多智能化的支持。那么，AI浪潮下，应该如何重塑会议与协作体验？

在谈到AI为视频会议带来的改变时，会畅通讯产品总监王晖提到，利用 AI 为企业客户提供定制化的功能，在会前、会中、会后都加入AI，让会议沟通更加有效率，开会体验更佳。科达-摩云视讯销售总监俞中则认为，随着底层音视频能力与AI自身学习能力的提升，视频会议的整体效果会演变得更加优秀，比如沉浸式的3D场景将会是 AI 大显身手的方向。

声网数字化会议解决方案负责人尚敬超认为，“AI 技术会让视频会议脱离工具属性，真正融入生活，例如原本成本较高的同声传译场景，通过 AI 也可以让多语言视频会议的成本进一步压缩，降低所有人的使用门槛。”

关于会议AI 的想象空间，京东科技协同办公业务部产品经理曾冠认为，“通过 AI 和穿戴设备，未来的沟通方式将从信息沟通变为“所见即所得”，帮助用户快速获取想得到的内容，从而更好的服务于工作。”尚敬超认为，“未来的会议主要是AI参与，人只需要最终下一个指令做决策，从而摆脱无穷无尽低效会议的束缚。而这背后，实时性和辅助决策也是最重要的两点。”（周小白）

（免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。）