出门问问被写入《中国合生成式人工智能应用与实践展望》白皮书!

近日,《中国生成式人工智能应用与实践展望》白皮书(以下简称“白皮书”)在 2024 年莫斯科举办的金砖国家工商理事会上正式发布。出门问问(02438.HK)作为此次白皮书编写的重要单位,以AI配音工具「魔音工坊」为例,展示了其在AI声音领域的强大应用能力及领先优势。

图片1.png

白皮书由中国联通研究院联合出门问问在内的13家研究机构共同研究撰写,聚焦生成式人工智能产业发展前沿趋势,深度洞察中国在生成式人工领域的应用与实践。

出门问问成立于2012年,是一家以生成式AI和语音交互为核心的人工智能公司,为全球多个国家和地区提供AI智能硬件、AI政企服务,以及面向创作者的AIGC产品。公司致力于打造国际领先的通用大模型,通过AI技术、产品及商业化三位一体发展,成为全球AI CoPilot的引领者。

出门问问拥有行业领先的AI基础设施能力、前沿通用大模型「序列猴子」,以及丰富的垂直领域软硬结合的优化算法技术模块,是为数不多的同时服务于内容创作者、企业、消费者三大类不同群体的公司。

面向内容创作者用户,出门问问致力于通过AIGC赋能内容创作,目前已构建丰富的AIGC CoPilot产品矩阵,包括AI配音助理「魔音工坊」及海外版「DupDub」、AI数字分身「奇妙元」及海外版「LivGen」、企业AI交互式数字员工生成平台「奇妙问」、可一键成片的AI短视频生成平台「元创岛」等,打造一站式内容创作平台,赋能创作者实现高效内容生成。

图片2.png

其中「魔音工坊」是一款集文案、配音、剪辑全流程一站式AI 软件,在海内外拥有超过800万注册会员,付费会员超60万。其具有六大核心功能,即软件配音、文字转语音、真人配音、声音商店、效率工具、声音克隆及视频编辑,并拥有有声音克隆、声音搜索、情感合成 / 角色迁移以及声音合成四方面声音黑科技。依托序列猴子大模型,「魔音工坊」可通过 3-10 秒的短音频,快速地实现声音克隆,并支持跨语言迁移、情感语气生成。其海外版 DupDub 还支持多语音音频生成,目前已涵盖英语、法语、日语、西班牙语、 葡萄牙语、泰语等。

以「魔音工坊」和新华社的合作为例,新华社将AI配音加入到新媒体AIGC创新平台后,分别用磁性播音腔、温柔女声、治愈童声等不同类型的声音为推文配上情绪匹配、朗读准确的音频。从文本导入到AI配音成本,通常只要几分钟,大幅缩短了文本配音时间,为新华社工作人员释放更多工作精力。

新华社还可以通过形象克隆和声音克隆技术,为记者或者主持人1:1克隆形象,极大的提升后续拍摄和剪辑的效率。在新华社客户端“问证”板块中,便新增了“数字记者”角色。根据真人记者形象,出门问问为其1:1克隆出了数字记者,并通过短视频形式出镜,随时随地为读者科普播报,报道新闻事件。

图片3.png

截至目前,出门问问的AIGC产品累计服务的用户数量已超1500万,注册用户数量超1000万,其中付费的用户数量约86.5万,公司已由传统AI项目制模式成功转型可持续增长的AIGC业务模式。

这样的成绩,离不开出门问问「产模结合」策略的支持。作为业内稀缺的坚持「产模结合」的公司,出门问问声音大模型与「魔音工坊」的配合典型地体现了「产模结合」数据飞轮效应。一方面「魔音工坊」自身的用户数据昼夜不息地反哺着声音大模型的训练,另一方面,声音大模型让「魔音工坊」不断自我突破,有着“超写实”自然音色的惊艳表现,吸引着全球数以百万计的用户深度玩转。

与此同时,「奇妙元」(海外版LivGen)、「奇妙问」和「元创岛」也通过「产模结合」,不断进行技术迭代与产品升级,实现用户规模与付费用户数量的双增长。

作为AI领域的先行者,2024年以来,出门问问持续深耕生态布局,先后与华为云、腾讯云、阿里钉钉等行业上下游企业达成战略合作,旨在共同促进大模型产业发展。

这也是出门问问参与此次白皮书的撰写的重要原因,即通过以往积累的AI应用探索与思考,与各位同仁碰撞出更多的火花;在输出中国生成式人工智能行业应用先进经验的同时,为行业未来的发展提供参考。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )