对于分不清东西南北的同学来说,只知道左右,不知道方向,所以当别人问你在哪里时,我们只能回答说:“我在XX大厦的门口,对面是个超市……”
虽然现在大部分地图都会直接告诉你往哪边走,但是,如果存在一个机器人可以充当你的向导,它可以在你都不知道自己在哪的情况下为你导航,不需要GPS不需要知道南北,你还可以用跟普通人交流的方式跟它交流,是不是更便捷呢?
就像以下这样——
向导:你在哪啊?
游客:我面前有一家店叫“布鲁克斯兄弟”
向导:是商店?还是餐厅?
游客:是卖衣服的,我身后还有一家银行
向导:好的,左转然后沿那条路直走。
……
这是由加拿大蒙特利尔大学和Facebook FAIR实验室研发的导航神经网络系统,叫做Talk the Walk,它能够在不使用GPS的情况下给人提供简单的语言方向,在该神经网络系统中,人们可以通过自然的语言与AI进行交流,帮助人们找到正确的位置。
在这个实验中,会导航的“向导”和路痴“游客”都是由机器人(bot)扮演的。
向导bot可以看到地图,知道要游客bot需要达到的目标位置,但不知道游客在哪里;游客bot只能360度看到自己周围的世界,但不知道目的地在哪,也不知道要怎么达到;因此为了让游客顺利到达目标位置,二者需要通过交流协作才能达成目标。
游客bot描述了他们看到的地标,比如“我就站在剧院旁边”,向导bot试图确定他们在哪里,它可以问问题,例如,它可能会问用户是否看到街角的商店帮助缩小范围。一旦它确定了用户的位置,它就会给出一个简单的语言响应,引导他们到达下一个路标点。
Facebook在纽约随机拍摄了很多张360度的街头照片,并将这些数据喂给了向导bot,向导可以将街景照片与地图位置相结合,所有信息了然于胸,从而对游客进行路线指导。在向导的指导下,游客可以根据要求观察周围的环境,以便让向导bot了解到游客的位置。
这是一个很新颖的实验,采用了一种叫做“嵌入式人工智能”的概念,在Talk the Walk中,向导bot拥有城市的2D地图数据,而游客机器人拥有丰富的360°可视化数据,但只有通过沟通才能执行指令。
怎么沟通呢?现实情况往往复杂很多,两个人在沟通路线时都不容易,何况是两个机器人?况且没有天生的“机器语”可供使用。
研究人员发现,当Bot使用更简单的符号来传达信息和位置时,完成任务的效果更好,这种交流方式被称作“合成语言”,这是一种数据通信方式,对机器人来说很管用。
研究人员提出了一个名为MASC(Masked Attention for Spatial Convolution)的机制,让Bot能快速从语言模型中解析对方回应的关键字的内容。Facebook表示,利用该流程可以使正在测试的结果的准确性翻倍。
这种交流方式也达到了该实验的真正目标:让Bot通过自然语言来处理收集到的信息。
对于Facebook来说,这是一项基础性的研究,它并没有打算把这些发布在地图产品中,所以该系统存在于一个长期的、不那么以产品为中心的领域。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与深度整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
- 特斯拉首次聘请品牌大使:韩国奥运射击选手金艺智
- 华为研发中心入驻上海青浦致小镇房租大涨,带动周边租房市场热潮
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。