图灵机器人拥有全球人工智能领域最好的中文语义技术,公司将核心技术提供给智能硬件制造商方案商,让客户的产品升级成拥有AI的智能玩具、智能家居、智能迎宾、智能客服等产品。
11.13-11.14日,由OFweek中国高科技行业门户主办,OFweek人工智能网承办的“OFweek17中国人工智能大会”在深圳举办。图灵机器人联合联合创始人郭家在“AI之多模态语义”主题演讲中,介绍了对于人工智能而言,语义的理解代表着什么,还有什么才是真正的智能机器人。
AI领域的核心瓶颈在语义
语义是AI领域的核心瓶颈,这一观点是AI巨擘马文·明斯基所说。郭家介绍到:“在国内,目前大部分厂商都由我们提供AI语义支持,我们公司的愿景便是让机器理解世界。”同时在大会上还讲了一个马文·明斯基的例子。当有记者问他有没有一项技术与语义同样重要,但是近期可能突破瓶颈的,马文·明斯基回答道:“没有。”也就是说目前语义已经成为人工智能亟待解决的问题。在人和人交互的过程中,很重要的信息是靠我们的交流中文字传达过来的,这过程中重点是我们如何理解决策和表达,我们公司理念是持续深挖语义的技术,最终让机器理解人理解世界。
在大会上,郭家还举了几个例子,比如,美国独角兽公司的Blue River,其实还只是smart machine,不能被叫智能机器人;再比如,机器人RoBoHoN,售价约合2万RMB/台,在日本已卖了3万台,当然这也与日本所处的环境有关,它所对应的场景主要是“男朋友送女朋友”,“家长送小孩”,以及“老人用”。通过这几个例子说明了什么才是我们认为的真正机器人。
多模态交互
富士康找到图灵说要跟你们合作做产品,我们说出了提供对话功能还要提供什么,他们说要把对话做到不仅仅是对话,还包括它的动作和表情,我希望把他们串在一起,我们紧接着想到了我们在很多年前研究过的技术,就是刚才讲到的多模态交互,多模态语义,我做一个动作说你和我,这个动作其实和我的语言是完全串在一起的。
有记者向世界数一数二的人形机器人科学家高桥智隆提问,机器人和手机的最大区别是什么?而在高桥智隆眼中,如果做一个人形机器人,或者是有人性的东西出来,那不光是能讲话,它的动作表情是能给你反馈的,就像我们养狗和猫就是他们能给你反馈,这就是我们做这个产品的理念,梅拉必安沟通模型,我们人和人交流过程中,纯文字只有7%,声音语调占38%,视觉肢体占55%,我们所有的交互过程中,其实纯文字的东西只是很少的一部分,大部分的信息是通过语音语调及表情和动作传达给对方的。
在国内目前图灵的多模态交互技术,至少是领先同行业一年以上,因为大家知道有做语音交互的公司有做视觉交互的公司,有做语音加视觉的公司,但是做多模态的输入和输出的,以机体神经元为基础的这种几乎还没有。
最后郭家还举出了一个例子,一个合作案例是我们现在跟耶鲁大学在探讨合作,它那边给出的模型,一个小朋友,在玩一个游戏,第一张图是纯粹的在电脑上学习,第二张图右上角放一个小鸡会给他做一个时时反馈,第三个放一个真的玩具小鸡不仅会给他反馈还有动作反馈,比如这道题做错或做对了,他那边研究学习效率直线上升,这也是我们深挖儿童学习场景的重点方向。
更多详细内容,敬请关注OFweek人工智能网后续专题报道!
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )