4月25日消息(南山)作为AI技术的重要应用方向,数字人去年以来迅速崛起,凭借“24小时直播”、“只需一部手机即可直播”、“低成本高收益”等卖点,成为电商、营销、文旅等一众行业的新宠。但问题也随之浮现:数字人不够真实,直播效果不佳;供应商鱼龙混杂,软件价格暗藏陷阱;电商平台态度不一等,为商家采用这一新型AI技术带来了很多困扰。
很显然,电商直播数字人市场还处于草创时期。百度尝试通过AI技术创新实现引领,在4月25日举办的“Create 2025百度AI开发者大会”上,百度创始人李彦宏发布了高说服力数字人,他介绍说,高说服力数字人具备声形超拟真、内容更专业、互动更灵活的特点,相比传统数字人文案枯燥、动作少、机器音重等问题,高说服力数字人在表情、语气、动作等都非常自然,甚至表现力超过真人。
而在这背后,发挥作用的重要是 “剧本生成”能力,能让表情、语气、动作都匹配台词内容实时调整,让数字人的情绪转折和动作切换顺畅。
比如现场演示的高说服力数字人讲《苏轼十讲》视频,可以看到慧播星生成的艾弥儿数字人非常逼真,表情、语气、动作都十分真实,和真人无异,匹配台词实时调整,情绪转折和动作切换都很顺畅,直播表现力甚至超越真人。
据悉,在文心4.5 Turbo和文心X1升级版的基础上,通过视频生成、剧本驱动多模匹配、高感染力TTS等能力建设,打造出的一种超拟真、会思考、能协同的数字人。
让数字人超越真人,无疑极具吸引力,带来了巨大的想象空间。问题在于,这是现在,还是未来?
逼近真人与超越真人
相比以前的数字人,在百度App电商平台中直播的数字人,不仅外形如同真人,言谈举止甚至一些不经意的小动作,也和真人一般无异,还能够和买家互动,浑然让人忘记对面其实是一个虚拟人物,
可以看到不少数字人主播已经“营业”,效果极为拟真,不仅外形如同真人,言谈举止甚至一些不经意的小动作,也和真人一般无异,还能够和买家互动,浑然让人忘记对面其实是一个虚拟人物。
笔者基于个人的4分钟视频信息,创建了一个自己的慧播星电商直播数字人,并基于自己撰写的文案一键开播。视频直播中如同一个全新的自己:相貌一模一样,说话方式也几乎一样,谈论的内容则远非自己所能,让笔者感到新鲜的同时也感到震惊。
在动态的直播环境中,慧播星数字人的呈现效果,足够惊艳。百度副总裁、百度电商总经理平晓黎接受C114等媒体采访时表示,慧播星数字人直播基于真人底板,因而视觉感知实现了和真人直播一样的效果;同时,基于语音大模型,声音也实现了类似真人的表达感染力;基于预设的剧本,数字人的动作也更加协调、自然,除了直播,也会通过一些细节,例如翻看手机,展现出更好的亲和力。
百度慧播星数字人不仅拥有拟真的外貌和表现,它还拥有基于庞大云端知识库的丰富知识储备,从而做到“美貌与实力并存”。因此,在某种程度上来看,画慧播星数字人直播能够实现超越真人直播的效果。
上述逼近真人的表现之外,慧播星数字人还有庞大的云端知识库,无疑比真人主播更加“博学”、更具文采,从而在某些方面实现超越真人直播的效果。平晓黎提到,电商直播具有一定的门槛,渗透率还比较低,而通过慧播星数字人,大量商家将直接拥有直播能力,切入这一领域,从而实现销售额的增长。百度采取开放的态度,为商家打造了强大的数字人直播平台。
数字人有望迎来“DeepSeek时刻”
高说服力数字人的概念,建立在多项AI技术取得突破的基础之上。相比建模、绑定、渲染等传统数字人技术,以及上一代的语音交互、自然语言处理、视觉等AI技术,新一代大模型带来了多模态融合、脚本智能创作、自主思考决策、多智能体调度等核心技术,使得数字人能力、制作时间、成本等一降再降低,效果也迎来质的飞跃。
平晓黎重点讲解了两大新应用:一方面基于多模态融合,从大模型驱动的脚本模式,演进到了剧本模式。剧本模式在生成上不仅指导数字人主播表达的语言脚本,更是进入了剧本,直播时用什么样的表情和动作,语调是激情澎拜还是娓娓道来,均可通过“克隆”实现,以及业内领先的唇动生成技术,用户上传真人视频,可一键克隆真人声音、形象与直播间装修,0门槛开启24小时数字人直播。
另一方面多智能体协同实现了AI大脑,配合主播的口播文案,AI大脑能够实时调度素材,展现和文本一一对应的内容。而当用户提问时,AI大脑也能及时根据用户需求,调度视频来呈现用户想要看到的画面。这种毫秒级的响应能力,让专业讲解变得可视化、记忆点十足,同时主播还能够根据用户历史行为,主动发起提问和用户互动,且能够持续互动,从而说服用户“买买买”。
基于文心4.5turbo等大模型作为底座能力,百度慧播星上线了“一键开播”、“一键克隆”等新功能,每一位入驻百度电商平台的商家,无需付费购买软件,均可0成本制作数字人主播,且灵活切换主播风格,从而带来业务的增长。乱象横生的电商直播数字人市场,可能迎来了“DeepSeek时刻”,人人皆可直播,带来了巨大的创造力。
AI大模型的“杀手级应用”
在Create 2025上演讲时,李彦宏认为数字人是2025 年最令人激动的突破性应用之一。
基于高说服力数字人所呈现的突破性创新,笔者看到了数字人彻底摆脱传统动作神情呆板、声音机械化缺乏情感等形象,变得“有血有肉”,甚至展现出一个有趣的灵魂,有望成为AI大模型的“杀手级应用”。
百度做了大量工作。在技术侧,百度慧播星在IDC评选的综合实力排名行业第一基础上再度升级,高说服力数字人首先说服的是广大商家,再由商家说服顾客;在市场侧,据平晓黎透露,百度正在通过业务部署,正在与外贸商家密切沟通,帮助他们出口转内销,打开新渠道。数字人是重要一环,可以帮助外贸商家更低成本、更快地适应国内电商市场,无需招聘直播团队、准备直播场地,即可开展直播电商业务。
尽管和真人主播、尤其是头部大主播的人设打造、粉丝经营相比,数字人主播还存在不足,但从新一轮技术突破的角度看,数字人主播已能成为商家直播电商的重要帮手,起到辅助甚至主攻的作用,也拥有了成为头部主播的潜力。尤其是教育、图书、医疗、法律等考验主播的文化素养或知识技能的领域,数字人直播凭借拥有云端知识库的AI大脑,能力已整体超过真人主播。
用户用百度慧播星创造一个数字人直播,或者在百度App上观看几场数字人直播,就会直观地感受到数字人技术的巨大突破。随着AI技术迭代,数字人直播电商市场有望快速越过草创期,进入行业走向规范、繁荣的发展期。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。