7月3日-4日,“Baidu Create 2019”百度AI开发者大会在北京国家会议中心隆重举行,大会聚焦产业智能化,向业界展示了百度最新的技术进展和落地实践。在此次大会的百度AI交互设计论坛上,百度人工智能交互设计院院长、百度设计体验委员会主席关岱松与其设计团队共同向外界展示了百度人工智能交互设计院基于深度学习的人因工程,以及百度AI交互设计在无人驾驶、智能硬件、百度大脑、机器人、AR、VR等方面协同发展的实践,并发布多项最新AI交互设计成果,不仅包含全新升级的小度交互设计系统,更有AI交互设计助力产业智能化的最新探索。同时,三款基于百度自然情感交互系统NIRO开发的软硬一体化创新机器人也在现场首次亮相。
以下为演讲实录:
各位开发者,各位嘉宾,我是百度AI交互设计院人机探索实验室的负责人,大家上午好。今天大会设计分论坛的一个重要主题是AI交互设计如何助力人工智能产业化升级。服务机器人产业在过去几年中国都有超过35%的增长,而这其中在家庭和公共场所主要功能是教育、娱乐、咨询、业务办理的服务机器人正在被越来越多的人接触到,它们依赖的能力中非常重要的一部分是人机交互能力。
为了提升机器人的人机交互能力,在去年AI Creat 2018我们发布了机器人的自然情感交互系统NIRO1.0,NIRO1.0包含三个层次:机器人自然语言交互模型、人类情绪应对模型、机器人主动交流交互模型,通过这三个模型可以让机器人的语音交互更高效、能主动服务、有情商。推动行业进步的根本途径是提升体验,人机交互系统只是体验的一环,只有和硬件能力相互结合发生化学反应,才能更有效的提升机器人的体验。因此在过去一年里我们与百度内部多个团队进行合作,通过软硬一体化打造了多款机器人产品。今天是这些产品第一次对外展示,大家先睹为快。
第一款产品,“现实版的大白”——公共服务机器人NIRO-Max,它是百度AI交互设计院人机探索实验室以NIRO为基础,从ID、人机交互到结构工程、机械工程,为百度智能云打造的新产品,将在今年第三季度正式推向市场。
目前服务机器人的主要使用场景是公共区域,且市场依旧处于非常早期的阶段,用户并没有在人机交互层形成固定的使用习惯。因此服务机器人成功的关键是两个维度:感官体验层和使用体验层,只有它们形成正循环,产品才会越来越多的被使用。
机器人的外观设计和其他所有产品都不一样,根据日本机器人专家森昌弘“恐怖谷理论”,当机器人外观很接近人时反而会让人觉得恐怖,这是非常特殊的,因此机器人的外观设计不仅是设计学更是认知科学,比如面部是不是越具象越好?肢体究竟要多完整?为了解决这些问题,在设计NIRO-Max时我们设计了几十种面部和肢体的组合模式,按三个维度进行了14天超过500次的测试,最终找到机器人面部和肢体配比的舒适区间。并且通过研究发现机器人头部形态如果接近于婴儿的头部形态更能激发好感。
机器人简单的外表下隐藏了复杂的加工工艺和元器件组合,比如为了保障面部透光率和表情均匀,我们重新设计了喷漆路径,并在基材加工上做了镜面抛光和增透处理。为了让机器人呈现出丰富的表情,我们在机器人这么小的头部内定制了小体积超短焦的激光投影,它的投影比例达到0.3。
如果说机器人的外观决定了是否能吸引用户首次使用,那么使用层的体验将决定它是否被反复使用。在使用体验层我们为机器人设计了两种交互模型:语音交互模型和主动交互模型。
在语音交互维度,语音交互主要分为远场与近场两个场景,在远场使用的交互模型是“唤醒-响应-输入-理解-行动/回答”的交互模型,这种交互模型在智能音箱产品上已经打磨的非常成熟。但是服务机器人的语音交互更多的是在近场发生,目前主流的唤醒方式有两种:按钮唤醒和人脸唤醒,而按钮唤醒需要寻找(按钮),不易使用;人脸唤醒易误唤醒,抗噪能力差。为了解决这些问题,我们为NIRO-Max设计了两种唤醒方式:多模自然唤醒与触感唤醒。
多模自然唤醒是利用高清摄像头判断用户是否在和机器人说话,加麦克风阵列的定向收音增益,它不仅支持多人嘈杂环境下的自然唤醒,而且可以随时打断。通过这种方式它的交互效率比唤醒词交互效率提升5%,“唤醒+指令”分开输入主观感受体验提升56.2%,“唤醒+指令”连续输入主观感受体验提升31.2%。
触感唤醒模仿的是人与人之间通过触摸来唤醒彼此的方式,NIRO-Max通过头部、肩部、手臂、手掌共7块触感传感器,来支持触摸唤醒。触感唤醒不但还原了人类自然的唤醒方式之一,还可以增强趣味性,拉近用户与产品的距离。
主动交互通过减少用户输入来提高服务效率,而主动交互的难点在于在什么场景下要用什么形式进行什么程度的主动交互。NIRO-Max根据机器人的与用户的距离、机器人的状态,设计了三种主动交互方式:主动询问、主动展示、自主巡航。
主动询问是当用户走向机器人正面小于1.3m时,这时候对用户需要服务推断是比较准确的,机器人会根据当前位置、人脸识别等信息主动询问某项服务。而当用户与机器人的距离处于中场,当检测到有过往用户在1.3m到3m之间慢速行走并看向机器人,或停下来看向机器人时,机器人主动展示自身能力并询问是否需要(服务)。
主动巡航的基础是3摄像头+双雷达感知能力,基于这种能力,NIRO-Max可以根据设定路线巡航并在人群聚集处停留一段时间,通过界面播放服务内容,这大大提高了机器人的覆盖区域。
机器人的功能层质量以体验层为基础,感观层通过科学的设计做到强的交互意愿度,在使用层以NIRO系统为基础,通过自然唤醒、主动交互让机器人可以有高效的交互、更多的服务时间。
在过去一年基于NIRO的设备不止于此,还有会议室智能助理机器人NIRO-Hi,通过内置NIRO它可以实现一步拨打语音电话,以及语音交互智能屏机器人NIRO-View,它可以实现多人全自然的语音交互、主动展示信息,还有刚刚展示过的NIRO-Key可以通过预识别实现无停留通行,它们都是基于NIRO的软硬一体化创新,通过NIRO它们都能实现更自然的语音交互、主动服务用户、有情商,而越来越多的设备使用NIRO也推动了NIRO能力的提升。
通过一年与机器人产品的软硬一体化结合应用,不断的实践升级探索,今天我们将推出增强版的NIRO——NIRO2.0。NIRO2.0从即日起开放申请,它将扩展两方面的能力。第一,机器人的自然语音交互模型由单人扩展为多人,这种能力从即日起可以使用。第二,新加入了机器人的自然动作引擎,可以让机器人的动作流畅自然且在动作幅度、速度上具备一定随机性,这种能力是今年8月开放使用。目前前面所列举的机器人产品的人机交互系统已升级为NIRO2.0,也欢迎大家访问NIRO官网获得这些能力。希望越来越多的NIRO设备可以被创造。
谢谢大家!
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- Anthropic研究发现:打错字可助攻解锁GPT-4等AI模型秘密
- 小米新车发布:YU7亮相,小米注册全新商标,揭秘第二款车的神秘面纱
- 一汽大众高层变动:潘占福"下课",谁将接任党委书记、总经理?
- 2024新能源汽车行业破茧而出:技术落地与绿色变革的双重挑战
- 中国新能源市场大热:最高省市渗透率超7成,油车逐渐淡出视线
- 特斯拉Cybertruck漏油问题严重,提车3天需维修1个月,车主怒火中烧
- 360大模型:重新定义AGI,打破行业现状
- 小米汽车与蔚来联手破解充电难题:合作共赢,补能无忧
- 谷歌秘密探索:Claude模型助其Gemini AI升级,揭秘AI未来发展新路径
- 辛巴病痛自述引泪奔,直播间真情流露
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。