原标题:虚拟人“觉醒”年,见证一场万物的进化
麦克尼尔的《世界史》被公认是全球通史开山之作,他是这样形容人类文明起源的:当文化演化超过生物演化而占据首要地位时,严格而恰当意义上的人类历史便发端了。
之所以联想到这一典故,是因为近年来虚拟人发展得如火如荼,已经不局限于如何在技术手段上更像人(生物演化),也开始呈现出文化上的生机勃勃,广告代言、举办脱口秀、时尚博主、客服主播等等诸多新身份,也造就了虚实融合的“新文化”。
近日OPPO 开发者大会上更赋予了虚拟人一个新的能力,成为业内首个具备虚拟数字技术交互体验的手机智能助手。此外,OPPO 以小布助手为入口,开放了小布生态,未来开发者可以在平台上定制专属的小布虚拟人,搭载在多个智能终端设备上。
从个体进化到群体创生,从技术概念到商业生态,从这个角度来看,虚拟人这一“新物种”的文明历史,在2021年已经正式开启了。
那么,当虚拟人“觉醒”,会给我们的生活带来哪些改变?万物互融时代,虚拟与现实,数字世界与物理世界的边界依然清晰吗?对于开发者来说,为什么虚拟人会是至关重要的一种能力、一个机会?
虚拟人觉醒年
说今年是虚拟人技术的“觉醒年”,并不为过。资本层面,许多虚拟人相关技术公司、AI公司都收获了不少来自头部互联网企业的投资。消费者层面,今年科技企业也集体亮剑,将更多虚拟人形象推送到大众面前。大致可以分为三个流派:
一、偶像派。2020年,由虚拟人技术创作完成的马丁·路德·金登上了《时代周刊》,新一波虚拟人如口红代言人的LING翎、时尚博主AYAYI等等,展现出了“带货”能力。技术上使用图形渲染、动作捕捉、语音合成等,尝试打造出逼真的拟人形象。这类虚拟人,往往需要过硬的作品和内容来延续商业价值,比如初音未来、洛天依等虚拟偶像,都有制作音乐专辑、举办演唱会等等,而不局限于一张完美写实的仿真脸及人设。
二、学术派。虚拟人要实现自然流畅的交互,模仿人类的表情动作,对技术实力要求很高,这也吸引了许多学术机构参与进来,比如清华大学计算机系知识工程实验室的虚拟学生华智冰,浙江传媒学院和厦门大学相关团队联合打造的虚拟人“西小施sisi”等,没有明确的商业化场景,主要是向大众展现虚拟人技术的最新能力。如果达不到大众预期,或者出现“换脸”之类的负面新闻,就会给虚拟人IP蒙上阴影。
三、实用派。偶像派需要作品,学术派考验技术,但企业还是需要与用户进行有温度、有情感的互动怎么办呢?于是实用派虚拟人纷纷登场了。它们大多是由企业机构与科技公司合作推出的标准化方案,代替真人进行内容生产和简单交互,比如虚拟主持人、数字航天员、虚拟导游等等。这类虚拟人并不需要高度拟真,技术难度相对较低,但也因为定制周期和成本较高,无法快速大规模推广。
听上去,似乎虚拟人只能作为一种被观赏的景观,停留在数字世界里。这就够了吗?
虚拟人走红的本质原因,是现实世界与数字世界之间,需要一种更具视觉化、沉浸式和情感温度的交互方式。因此,作为两个世界沟通的桥梁,虚拟人还有很多想象空间。
举个例子,随着智能技术的发展,手机不仅是各种数字应用服务的中心,与其他IoT设备的联动也成为常态。万物智联更需要以人为中心,围绕生活场景和行为习惯,实现智能设备间的无缝协作,让用户更便捷地获取想要的服务。
以往这种从硬件到软件,从技术能力到服务应用的服务体验,主要是依托智能语音助手来完成的。但是,语音交互更多的是简单机械化的指令,能够表达情感的地方很有限,难以撬动用户心中温柔的情绪,与智能助手形成情感上的连接。更丰富的交互方式,是人机交互的演进方向,而具备语音、语言、3D视觉效果的虚拟人,自然也就成为语音助手的进化体。
可以预见的是,接下来虚拟人将在技术、场景、产业的浇灌下,展现出更大的生机与可能性,成为人机交互的全新方式。
基于以人为本的用户洞察,OPPO思考很多,动作也很大。就在今年9月,OPPO率先推出了 “小布虚拟人”又在前不久的ODC开发者大会上,将小布升级为业界首个基于虚拟人多模态交互的手机智能助手。
一场“新人类”的进化
进化的过程并不是一蹴而就的,需要在几个关键节点上都发生正确的“突变”,才能演变出一个全新的物种。
想要让虚拟人进化成为万物智联、人机无缝交互的核心,究竟分几步?今天就以OPPO小布虚拟人为线索,看看虚拟人的“初长成”需要解开几重结界。
第一重结界,多模态融合的交互能力。
我们可以将小布助手,看作是“虚拟人”的胚胎。作为搭载在OPPO智能手机和IoT设备上的智能助手,今年2月,小布助手成为国内首个月活用户破亿的手机语音助手,而成为人机交互入口,毫无疑问,小布是一颗极具生长潜力的“种子”。
如何让这颗“胚胎”,生长出自然逼真的感知系统、感官形象、思维大脑,成了“小布虚拟人”生命的起点,依赖于语音、视觉、自然语言处理等多模态融合算法。为此,OPPO多年布局的全栈式AI技术,就成为这一生命体的温床。
首先,架设了AI整体技术架构,包括混合云基础设施、云原生数据湖、端云一体机器学习系统,以及语音、NLP、知识图谱、CV、推荐搜索等AI能力层,跨终端、多场景落地的业务应用层,为企业提供安全可信的AI安全能力层……这一基础架构能够为虚拟人所需要的AI能力提供基本的算力、算法、安全等全方位保障。
其次,针对性打造虚拟人相关能力。作为有温度的人机对话沟通载体,虚拟人需要在语言、表情、动作等方面都自然流畅,这就要求NLP、机器视觉、TTS语音合成等等多种基础AI能力都达到国际顶级水平,才能让用户不感到违和。为了让小布虚拟人达到较高的呈现效果,OPPO技术团队今年上线了基于知识图谱的NLP预训练大模型,通过自建知识图谱与对话上下文等信息嵌入,结合公共以及小布积累的大数据集,融合后进行大模型预训练,精准判断用户语言中的意图。通过UniLM统一预训练语言模型,生成更贴近上下文的对话内容,让用户在与小布助手的交互过程中,能够对答如流,满足用户闲聊的需求,目前满意度超过85%。
另外,虚拟人还需要展现出声情并茂的面部表情和肢体语言。为此,OPPO通过ORTC窄带高清、大规模低延时等基础创新技术,依托小布助手的综合AI能力,实现了在多个场景下与用户的实时情感化交互,让用户于小布的交互不会因为计算处理、网络问题而卡顿,变得更加自然、真实。
基于这些硬核的AI能力,小布虚拟人才变得能听会说、活灵活现,成为与用户智趣相投的数字“生命体”。
第二重结界,从软到硬的服务能力。
人类走向文明的体现,是学会使用工具来为自己服务。如果小布虚拟人只能停留在手机里插科打诨,那和其他虚拟人也就没什么差异了。
如前所说,OPPO在内的硬件厂商早已不局限于手机这一单品,都在发力多终端、多场景的智慧生活,这也使得消费者对于打破软件和硬件之间的结界,用一个数字助手调度多种硬件的能力,有了迫切的需求。
用一个词来总结,就是服务泛在化。具体有四大特性:人与设备间的交互将更加自然无感,虚拟世界的真实渲染与现实趋于融合,多设备无缝互联互通,服务体验随人流转。
对此,OPPO研究院院长刘畅认为,泛在服务的趋势,对开发者和平台提出了更高更全面的要求。
作为多端融合的服务调度工具,小布虚拟人也就具备了“软硬服一体化”的差异化能力,给消费者带来了实质性的体验改变,也让自己变得与众不同、独一无二。
面向未来的全新服务形态,小布虚拟人具体能做些什么呢?
首先是感知,作为用户与机器互动的入口,通过语音、视觉等多元化信息融合感知,具备数据感知、数据采集的基本能力,为主动服务提供数据养料;
其次是计算,借助AI大脑的计算分析处理引擎,将多维信息综合处理,化繁为简变成高效服务传达给用户,让无处不在的应用功能可以被高效触达;
最后是生态,未来除了手机,平板、冰箱等各种带屏设备,都需要更具情感色彩的人机交互,这时候虚拟人生态的形成,可以汇聚开发者和IoT厂商,为消费者联合打造千人千面的是虚拟人,让有温度的智慧服务无处不在。
从这个角度看,软硬服一体化的小布虚拟人,也成为实现泛在服务、智慧生活时代的关键。
第三重结界,从应用到生态的支撑能力。
应对物竞天择,最好的方式是,形成一个庞大的物种生态。对于小布虚拟人来说,要给用户提供更丰富、更多元的AI服务,无法依靠一家企业来独立完成,需要引发用户、开发者、合作伙伴们的多维互动和创意。
以往虚拟人的开发者是企业自身,为自有产品和服务提供支持,运营模式相对封闭。如何寻找更多场景激活更多服务,成为虚拟人技术为用户提供更多价值的前提,才能形成欣欣向荣的生态图景。
生态的打造是一件复杂工程,开发者们的创意飞扬,也需要工具、资源、算力等底层支撑。从小布开发者平台中可以看出,OPPO对开发者的支持可谓是诚意满满。
一方面,提供一站式、能力完备的平台工具与服务。小布开发者平台,以OPPO全栈式AI技术能力为底座,覆盖了底层的数据和算力基础,搭载了各类语音、对话、视觉、图谱、多模态交互等AI基础能力,上层各类平台,如BVS语音服务、AIoT云平台、技能平台、以及虚拟人定制平台。让设备接入、虚拟形象定制、功能开发等都变得便捷高效,每一位开发者都能定制专属的小布虚拟人。
另外,开放从软件、硬件到服务的OPPO生态资源,助力“冷启动”。以小布AIoT服务平台BVS为例,就与IoT行业特别是智能家居行业展开互动合作,IoT厂商的主控设备如音箱或控制面板,通过BVS可以快速接入小布智能云,开发者应用可以实现一次开发、多端触达,开发出的虚拟人可以搭载在OPPO生态中多个智能终端设备上(电视、手机、手表等带屏设备),收获商业价值。
时代考题与OPPO公式,打开产业之变
对于开发者来说,万物互融时代,既是潜力无限的金矿,也是一个充满残酷挑战的竞赛。
潜力在于,为用户提供一致的多维多场景体验,开发者能够触及更多场景,降低开发成本,收获更大的认可和商业成功。
挑战在于,虚拟人这样的新物种也是顶级技术的综合体,并且需要产业配套来推进,单打独斗的普通开发者很难找到适配自身的场景和突破口。
对于智能终端品牌来说,与其自筑城池,不如开放自己,成为产业变革的推动力,汇聚开发者的力量,建立新技术体系下的话语权和创新输出能力。
从此次ODC大会中我们观察到,OPPO在重度投入、赋能开发者上做得非常深入,思考得也很透彻,将其拆解为一道综合考题。
智慧生活的一道加法题,S多维场景与O全链路运营,围绕人的生活场景和行为习惯,OPPO将开放统一的连接框架,让开发者具备给用户全场景互联互通的服务能力,实现全场景、全链路的服务优化,可以更容易、更高效、更精细地找到机会,扩展触达用户的广度和深度。
人机交互的一道乘法题,T是OPPO主导的软硬融合技术,小布能实现多终端、多模态的人机对话,打造人与设备间更加自然无感的交互体验,为开发者提供创新源动力,获得必备的AI能力。
泛在智能的一道乘积题。以OPPO 全栈式AI技术能力为底座,通过小布实现智能设备之间的万物互融,开发者可以创作出定制化的虚拟人,和用户之间进行更多形态的情感化交流,让虚拟世界和真实世界之间的交流变得不再单调和枯燥,进而实现泛在智能的指数级增长。
由此,也形成了下一代生态势能公式NEPE =T(S+O)i生态模式。
在小布虚拟人身上,我们能看到这一公式的落地应用,真正达到了软硬兼施、内外兼修,OPPO开辟出了一条全新的赛道,这将是产业改变的初始。
这也让我们相信,只要技术不断浇灌,智慧生活会在开发者的想象力中,向更深处进化,未来还无尽可能。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 美媒聚焦比亚迪“副业”:电子代工助力苹果,下个大计划瞄准AI机器人
- 微信零钱通新政策:银行卡转入资金提现免手续费引热议
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与深度整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。