11月7日消息,在浙江乌镇第五届世界互联网大会上,搜狗CEO王小川宣布与新华社合作开发了全球第一个全仿真智能虚拟主持人-“AI虚拟主播”。
在现场演示中,观众只需要输入一句新闻文本,屏幕上就会出现一位虚拟的新华社新闻主播,它不仅能用真人一样的声音进行播报,同时连面部表情和唇形也完全吻合。
“AI合成主播”发布之后,搜狗人工智能的核心技术“搜狗分身”也浮出水面。此项技术能够通过人脸关键点检测、人脸特征提取、人脸重构、情感迁移、唇语识别等多项技术,并结合语音、图像等多模态信息进行联合训练后,生成和真人无异的AI分身。
据搜狗公司智能语音事业部总经理王砚峰介绍:
“搜狗分身”技术是搜狗人工智能的核心技术之一,该技术能够利用搜狗的AI能力,从图像表情,声音语言习惯,逻辑思维等层面对AI进行拟人化训练,然后克隆制造人类的AI分身,进而帮助人类提高信息表达和传递的效率。
罗超频道(微信ID:luochaotmt)认为,搜狗之所以能研究出这项技术,与其核心业务有关。搜狗输入法起家,进入搜索业务,一直都跟语言打交道,其AI战略也是围绕语言AI。目前搜狗输入法已经是中国最大的语音输入引擎,这让搜狗积累了大量的语料和用户行为基础。
“AI虚拟主播”似乎在功能上已经可以代替主播播报了。虽然短时间内难以普及,但是依托于搜狗分身这种技术,依然能够提高媒体在新闻时效性、多语种传播等方面的能力。
“AI虚拟主播”实现了播报能力,可以想象一下,也许将来搜狗的“搜狗分身”技术会让虚拟主播具备一定的“情感能力”。当用户与机器人交谈时,会很难察觉到他只是一个机器人。比如此前在Google IO 大会上,Google的机器人订酒店就实现以假乱真的效果,它甚至故意模仿人说话的停顿语气。
目前,智能音箱正在成为新的入口,也许未来虚拟主播可以发展成为虚拟私人助手,实现单纯的从音箱声音交互到与虚拟的逼真人物交谈。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。