导航中的明星语音包难道是请明星在录音棚一句一句录制的吗?
当然不是!试想导航中数不尽的地名,以及到达时间与路程距离等变量数据,要求真人录制是不现实的。
当下被人们所熟知的“语音包”其实是应用的语音合成技术,又称TTS(Text to Speech)。语音合成技术也是当今国际人机交互领域竞相研究的热门技术之一,合成音的应用极大减少了人力录音的成本,成为了智能机器的标配能力,帮助厂商打造voice-IP。
思必驰提供数十种语音合成预设方案作为音色选择,同时还可以对合成音进行大数据深度定制与小数据快速定制服务。无论是逼真自然的智能客服机器人,还是个性十足的声音复刻,思必驰语音合成方案满足你对TTS的全部幻想。
关于语音合成的效果,一方面依赖算法模型,另一方面,依赖于用户提供音频语料的质量。所以在音频语料的采集上,建议用户在安静的环境下进行,说话语速匀速、声音大小适当、音色尽量一致、不要喷麦。语料音频质量越高,合成音效果自然越贴近真实人声。
AI+艺术,跨界探索声音的价值
除了被人们广泛熟知的智能助理,语音合成在艺术文娱领域正在探索应用之道。
2019年12月2日-8日,第十届中国国际新媒体短片节在深圳举办。在活动期间,短片节组委会、量子动力携手思必驰联合开发打造的AI数字人“陆川导演”与中国首个AI 虚拟偶像“子书美”与观众见面。虚拟形象不仅要看得见,其高辨识度的“嗓音”更是重要的声音名片。
AI数字人陆川导演“造声”的关键在于逼真。基于思必驰神经网络建立的语音合成学习模型,将采集录制的陆川导演本人的音频进行训练学习,合成出了以假乱真的AI数字人陆川导演的声音。此外,短片节现场的观众,还可以体验与AI数字人陆川导演现场对话问答。
中国首个AI 虚拟偶像子书美还作为本届中国国际新媒体短片节的形象大使。与复刻AI数字人陆川导演的嗓音不同,子书美的合成音需要“凭空创造”。思必驰结合子书美形象性格与人设属性,为其量身打造了一款知性优雅的合成音。闻其音,如见琴瑟书香,突破次元,仿佛子书美就是生活在我们身边的一位才女。
AI+艺术在本届短片节上的结合是对未来文化艺术产业发展趋势的预测。与真人相比,AI虚拟形象具有其独特的传播优势。兼有其原本次元中的无限创造性与现实世界中人文价值的AI虚拟形象,通过AI融媒体提升媒体生产能力和水平,创作出更贴近艺术创想形态的作品形式。通过AI虚拟形象替代真人偶像的部分工作,或许文艺工作者的某些因工作强度或压力过大而产生的惨剧便可避免。
AI跨界文艺,思必驰一直在做的事情
《机智过人》第一季中,思必驰团队打造的“小驰机器人”现场用撒贝宁的声音生成了一曲《好久不见》。
《经典咏流传》第二季中,思必驰携手栏目组共同推出 “读诗成曲”线上互动小工具。思必驰创造性的将语音合成技术升级为歌声合成技术。用户仅通过读出几句诗的小数据,便可快速生成有腔有韵的歌声。
写在最后
语音合成,好比AI时代的活字印刷术,创建一套合成模型,便可以“印出”你想要的声音。语音合成出的声音,以前所未有的方式改变着信息传播交流的形式。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。