7月11日-12日,聚集了世界学术顶尖学者、科学精英、创新者和企业家的iCANX Davos Summit 达沃斯科学峰会在瑞士达沃斯圆满举办。同期,由iCANX Association主办、未来智能协办的“人工智能+:探索发展前沿与引领趋势,培育新质生产力论坛”,也邀请了全球范围内的人工智能交叉学科领域的科学家齐聚一堂,共同探讨人工智能的前沿和趋势。
未来智能董事长胡郁在论坛上发表了主题演讲,分享了他对AIoT时代人机交互方式的理解与展望——“经历了图形交互界面、触摸交互界面,下一个革命性的人机交互方式会是什么?”
在漫长的人机交互历程中,人与实物如何产生最自然、最舒适的交互,一直是科学家和工程师们研究的重点,而近年来随着人工智能和物联网的兴起、深度学习和大数据技术的发展,人机交互也逐步从图形、触摸到语音不断进阶,到如今,人类最自然便捷的沟通方式——语音,早已成为人机交互的主流趋势。
在胡郁看来,“语音之所以厉害,是因为机器有显示屏,可以把文字、图片、音频和视频直接播放给人看。而人并没有显示屏,要将大脑里的想法告诉机器,除了跳舞、画画、写字、打手势,还有一个最直接的办法就是讲话,而这就需要机器刚好听得懂我们讲话。”
但事实上,要让机器听清、听懂人类语言并不是一件容易的事,在噪声干扰、多人语音混叠的情况下如何精准识别?在多语种情境下如何准确翻译?都是语音交互发展的关键瓶颈。
未来智能作为一家AI硬件公司,核心团队成员在AI语音领域已经深耕超10年,从智能语音助手到AI会议办公,讯飞会议耳机不仅可以在多人语音混叠的会议场景中智能识别出不同人物的声纹特性,实现说话人角色区分;还支持32种语言同传翻译,在多种语境下也可以实现面对面实时翻译以及同传听译。5月刚发布的讯飞会议耳机Pro 2全新升级“红点闪录”,无需连接App即可一键开启,为用户带来更便捷的录音使用体验。
更重要的是,讯飞会议耳机搭载的viaim AI,可一键生成摘要总结和待办事项,内置的“万姆”助理有问必答,通过对话形式了解用户需求,为其提供或有目的重点、或全面普适的方法与建议。
在本次达沃斯科学峰会上,胡郁就带领专家学者们一同体验了未来智能会议耳机的同传翻译功能,相关学者们也“现学现用”,迅速将耳机的“同传听译”和“摘要总结提取”功能用在了论坛的交流现场。
近年来,“大模型+语音”的发展模式,正在为智能语音技术和产业带来新一轮的革命性突破,在胡郁看来,对于人机交互场景而言,这还只是一个开始——“随着人工智能和机器人核心技术的发展,我们可以看到,以语音语言交互为主,以感知运动交互为辅的下一代人机交互系统的发展已经迫在眉睫。”胡郁说。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )