今年315晚会多家科技公司被点名过堂,骚扰电话、网络贷款、电子烟……搜狗也在315晚会成功登陆央视,不过却有不同角色。
315晚会开播前,搜狗与央视财经频道联合推出的AI主播“姚小松”正式上岗,在央视对3·15晚会进行预热。“姚小松”以央视主持人姚雪松为原型,基于语音合成技术,对其声音、唇语和表情进行模拟,实现了跟真人一样的主播发声和画面呈现。
AI主播的出现是媒体智能化的里程碑,也给AI技术落地创造了黄金场景。
AI主播应用前景广阔
这不是搜狗AI主播第一次公开亮相,去年7月,“姚小松”在香港RISE科技峰会上首次亮相,AI主播这一AI应用模式引发AI和媒体产业关注。
就媒体行业而言,AI主播应用前景广阔。
在碎片化时代,媒体必须满足多元化的新闻消费场景,视频新闻是重要的新闻传播形态,然而受制于制作成本只能支持少部分新闻,特别是非电视媒体。应用AI主播技术后,媒体可以更低成本不间断地生成视频新闻或者语音新闻,提高传播竞争力。
传播视频新闻制作流程长,从新闻脚本到视频录制需要一定的时间,因此有不可避免的滞后性,AI主播直接将文字转化为文字,延时更少,新闻时效性将得到大幅提升,众所周知,时效性、新奇性和重要性是新闻“三性”,时效性排在第一位。
传统主播可能会因为个人原因在实时类新闻节目中出现失误,机器与人相比出错率更低,因为不知疲倦,没有情绪,不会走神等等,AI主播基于AI技术智能生成新闻内容,出错率会大幅降低。
AI主播技术可以生成更多视频新闻,未来还可实现一个新闻快速生成不同语种版本,进而对不同方言/语种用户更加友好,甚至可以生成手语、语音等版本,满足有障碍用户群的新闻获取需求。
可以看到AI主播在媒体产业应用前景广阔,搜狗AI主播在315晚会这一行业瞩目的黄金时段亮相中国核心媒体央视,意义非凡:一方面,这表明主流媒体对AI主播这一技术的积极拥抱态度;另一方面,央视作为新媒体技术应用的佼佼者,对AI主播技术的应用也将吸引更多媒体同行关注,可以认为,搜狗AI主播技术将从此正式走向媒体产业,开启商业化之路,新媒体时代,中国媒体数量十分庞大,AI主播也有望给搜狗贡献规模化收入。
AI主播不会取代人类主播
很多人看到AI主播后,第一个想到的问题是,主播会失业吗?如果机器可以更低成本、更快速度和更低失误地生成视频新闻,为什么还需要人类主播呢?在我看来,短期内“姚雪松”不用担心被“姚小松”们取代。
首先,AI主播技术尚未发展到以假乱真的程度,效果距离真实主播有一定距离。长期来看AI主播的逼真度会越来越接近人类,不过因为不只是语音技术,还涉及到表情、唇形、感情等,要以假乱真难度很大,不断接近也需要算法长时间的进化。
其次,主播不是简单地读新闻,而是带有感情、情绪甚至信念去播报新闻,他们都会根据新闻内容进行不同语调神态风格的播报,机器人很难做到如此个性化,也很难做到人类主播一样感情饱满、收放自如和随机应变。
最后,主播很多时候有象征意义,或者说已经成为一个IP,比如很多国家都有官方新闻主播,我国就有多张“国脸”,很多电视台有自己的金牌主播,观众对主播会产生感情。
AI主播短期内不会取代人类主播,在可见的未来,AI主播将负责常规新闻的播报,AI主播的出现将解放人类主播,让他们从繁琐的常规播报中解放出来专注于重要内容播报,抑或向主持人转型,即AI主播与人类主播会是协作而不是替代关系。
相对于传统新闻播报而言,AI主播的价值将更多体现在新闻播报模式创新上。AI主播不只是可以实现更低成本、更快速度和更低失误的常规新闻播报,也可以改变新闻消费模式,进行各种创新。消费者对新闻主播会有自己的偏好,AI主播技术有望实现个性化的音视频新闻产品,比如对于一些已经退役的主播如赵忠祥,AI主播技术可以生成“替身”永久播放新闻,满足怀旧观众的需求;再比如用户可以选择自己喜欢的某个明星如林志玲作为原型,成为自己看新闻的AI主播——在千人千面的信息流时代,个性化新闻正在成为媒体行业的趋势。
媒体与AI技术正在加速融合,在AI主播外,机器人同传、机器人翻译笔、智能速记、智能写稿、智能内容审核,都在应用AI技术。
搜狗在AI+媒体上已经形成业务矩阵,在AI主播外,两会期间,搜狗智能录音笔C1在采访现场提高媒体采写效率;搜狗同传已成为首个商用AI同传,为500+国内外媒体峰会、科技大会以及体育赛事等提供同传服务。媒体的基础是信息,信息的基础是表达,表达的基础是语言,而基于语言的AI正是搜狗的差异化竞争力,媒体+AI成为搜狗的主场。
分身技术价值不止于AI主播
搜狗已推出多个AI主播,虽然原型不同,但背后技术却是一样的:都是“分身技术”,基于这一技术,只需要输入文字,就可以模拟原型语气语调、面部表情、说话逻辑等智能发音,这是搜狗核心AI技术,其利用搜狗语言AI能力,从图像表情,声音语言习惯,逻辑思维等层面对AI进行拟人化训练,然后克隆制造人类的AI分身,进而帮助人类提高信息表达和传递的效率。
换句话说,分身技术让AI具有了更丰富的表达方式,从文字表达走向音视频的富媒体表达,其不只是可以“克隆”主播,理论上也可以克隆每个人,让其拥有网络替身。
分身技术在智能助理甚至机器人上都大有可为,我们现在使用的智能语音助理都是千篇一律,每个人iPhone里的Siri声音都是一样的,基于分身技术,用户不只是可以定制智能助理的语音,甚至可以看到助理的虚拟面貌,声音和画面原型用户都可以定制,比如选择自己的偶像或者朋友,也可以给自己定制一个分身,通过智能设备去陪伴孩子、宠物或者女朋友。
分身技术是对一个人声音、表情、神态、外貌的模拟,因此理论上就可以实现对一个人的“复活”。乔布斯可以在分身技术加持下回归苹果发布会舞台,杰克逊可以在分身技术下复活现身演唱会与粉丝见面,每个人都可以通过分身技术创造虚拟替身。
分身技术有望改变动画片等以人类为原型的节目的制作方式,基于智能合成技术,真人电影可以智能转化为动画片,大幅降低动画片制作成本。游戏、二次元、直播、短视频等文娱内容产品,也有望应用分身技术来降低成本,实现更多创造可能性,比如用户可以观看分身技术生成的直播节目,或者二次元动画,并与偶像互动。
分身技术的本质是对语言、表情、神态、姿势等人类表达方式的智能化模拟,是人工智能的重要部分,这一技术应用场景将十分广阔,绝不只是媒体主播。除了前面提到的各种应用外,在教育、医疗、客服等行业,可以实现虚拟客服、虚拟老师、虚拟陪护,降低各行各业的人力成本。搜狗作为语言AI的领先者,围绕表达这一细分场景做精做细,在行业已经形成足够高的壁垒,正是已为此,不论是AI主播、智能媒体还是分身技术爆发,搜狗都会大概率成为最大赢家。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。