眼神科技周军:十年一顾,再谈多模态

2019世界创新者年会(World Innovators Meet 2019, 简称WIM2019),于2019年12月6日在北京·国贸大酒店拉开帷幕。本届大会由中国企业联合会指导,亿欧·EqualOcean、工业和信息化科技成果转化联盟联合主办,以“科创4.0:共建全球化新未来”为主题,6000余名来自美国、英国、法国、澳大利亚、瑞士、以色列、俄罗斯、西班牙、葡萄牙、印度、新加坡等二十余个国家和地区的创新者齐聚一堂,共同总结2019年世界科技与产业创新的成果,预测2020年最新创新趋势。

本次大会为期三天(12月6日-8日),采用“9+1”的会议结构,即于8日举办的“1”场创新领袖峰会,于6日和7日举办的“9”场主题论坛。9场论坛分别围绕当下最热门的零售新消费、金融科技、投资新趋势、智能硬科技、医疗大健康、产业互联网等领域,以及青年、女性和科学企业家等群体展开。

在12月8日举办的创新领袖峰会上,眼神科技创始人兼CEO周军发表了主题演讲。他的主要观点如下:

(1)多模态不是非此即彼的组合替代,而是基于数据融合的算法融合,并依托平台决策为支撑。

(2)“多模态”是AI技术的下一步,更是AI落地的必经之路。

以下是周军演讲全文(部分有删减)

感谢主办方的邀请。今天又站在这里,和去年不同,去年是讲人工智能,今天讲的是“十年一顾多模态”。这个单模态是什么,两模态是什么,三模态又是什么?多模态到底是什么?

  人工智能发展了这么长时间,大家对他的预期越来越接近实际情况。刚刚一个朋友问我,人工智能到底发展到哪一步了?说实话,我不知道。我突然想讲一个小故事。养宠物的人很多,当你回到家里面,小狗会根据你的情绪做出反应:你开心的时候,它会陪你一起开心;当你累的够呛在沙发上时,它会乖乖的呆在你的身边。我们家有一个小狗叫天球,如果昨晚它把你的拖鞋叼走了,当你早上醒来的时候,它会立刻叼回来;当你走向衣橱的时候,它会立刻跑到门口等着给你开门。这么简单的一个小狗,它能根据你的表情、行为时间,能判断出你是否开心并做出一系列的反应。

我想给大家说一下,就这么一个小狗的智商,人工智能需要花多长时间做到?按照现在的人工智能,或者弱人工智能时代,没有20年很难做到这一步。这意味着,人工智能再过20年都很难达到小狗的水平,那么达到小孩的水平需要多少年?

那么人工智能接下来该怎么做?什么是多模态?

让我讲讲多模态,眼神科技从事人工智能20多年,十多年前就在从事多模态的技术的落地,我有一些感想感悟、落地的案例和经验想分享一下。

多模态在去年开始成为焦点,很多知名企业比如说华为、腾讯、百度,这样的AI大厂,都开始逐渐的把目光瞄向多模态,很多创业公司也在思考这个方向性的问题。华为投资多模态语义理解的公司,腾讯的AI Lab的俞栋博士有那么一句话“多模态是迈向通用人工智能的重要方向”。通用人工智能是弱人工智能时代需要走向的一个方向,弱人工智能是 “见多识广”,解决的是感知的问题,通用人工智能具有几个属性:自学习、增量学习、增强学习,这些内容结合在一块,是强人工智能。从弱人工智能到强人工智能的奇点,截止目前还没有突破。 “见少知多”、“不见而预知”的强人工智能时代,这是很多年国际前沿人工智能公司一直努力的事情,技术遇到了天花板。

多模态指的是多传感器融合,不是非此即彼的组合替代。指纹识别、人脸识别、虹膜识别、指静脉识别,每一个技术、每一个算法用一个传感器解决一个问题叫单模态。随着AI的发展、信息增加,AI被赋能被期待的模态越来越多,比如文本识别,图片识别、文本和图片组合识别、图片和视频组合识别等,各种信息从不同的方位,不同的传感器到来,单一识别技术已经很难满足这样的发展。

如何解决识别误导和传感器感知局限问题,如何让机器像人一样感知和理解这个世界,我认为是多模态才可以解决的问题。眼神科技致力于让机器和人交流的时候,使机器具有像人一样的眼睛,眼神科技因此而得名。

多模态市场需求旺盛,国外领军企业坚持多模态。

国外知名的生物识别企业都在研究多模态,多模态已经成为生物识别发展趋势,EBA(欧洲生物识别行业协会)告诉我一个数据,到2023年欧洲生物识别的诉求达到115亿美金。根据我们公司去年的情况,我们的人脸、虹膜、指纹三种技术在公司业务中已经形成了“三分天下“的收入角色。

眼神科技在多模态生物识别领域已经耕耘了20年时间。从1998年到2005年,公司一直在做指纹识别,在这期间也发现了指纹存在的问题,于是和人脸进行融合。这个阶段是公司指纹技术发展、指纹和人脸融合的发展阶段;2005年到2013年阶段,这也是我来北京创业的阶段。在这个时期,公司利用成熟的指纹识别技术,打开了全国50%的银行市场。之后又开发人脸识别、虹膜识别技术,虹膜识别技术我们从2005年开始研发,到了2009年已经达到了全球顶级程度,这是整个基础算法形成的过程。

在面向市场的推广过程中,我们发现单一技术决策存在的一些问题,更需要打造分层决策,于是我们打造了ABIS多模态统一平台。整个公司技术研发过程中,我们获得了400多项发明专利,获得了国家技术发明二等奖。多模态决策体制是如何形成的?包含了融合算法,平台决策,ABIS平台三个方面,是基于数据融合的算法融合,并依托平台决策为支撑打造。

从AI应用最前线——金融行业看多模态

眼神科技的研发一直是陪伴一个行业长大的,这个行业就是金融行业。公司在1998年就开始研究指纹,2002年,我们开始定位银行并且做试验。指纹的发展存在的最大问题,就是有很多人天生指纹浅、经常参加体育活动和体力劳动的人指纹也非常浅,举例有一家公司有20万人,其中1%的人指纹识别困难,用解决方案也无法解决。“科技不从善“让指纹识别技术遇到了巨大挑战,于是我不得不把人脸和虹膜结合在一起解决问题。解决了银行内部风控的问题后,如何降本增效,如何获客成为银行发展的第二阶段。用人脸识别可以解决获客问题,可以做到人脸联网核查和VIP的识别。运营过程中又发现,尤其手机远端获客,在帮着银行降低成本和获客的同时,会遇到防伪的问题,人脸识别不能作为获客的单一的识别手段,于是我们把人脸和虹膜识别组合起来识别。随着银行开放和生态的建设,”追客”和”帮客”成为银行重要的需求,这对生物识别和人工智能提出更大的挑战。如何在场景中识别人、物、客,以及客户需求的把握、精准营销如何去做,让银行服务进入你的消费空间,进入你的生活,这个过程就需要生物识别技术的融合应用。今年,眼神科技中标了工商银行人脸识别产品引入和虹膜、指静脉算法提升服务项目,实现了指纹、人脸、虹膜、指静脉四项核心生物识别技术与工商银行全面合作。多模态是现在很多银行都在努力探索的方式。

到目前为止,眼神科技通过多模态生物识别技术,服务全球2000多家客户,渠道客户1000多家。经历了二十年发展,在国内可以说是陪伴金融成长,也可以说是被金融驱使,一刻没有停过,过去二十年一直在创新。总结一下,眼神多年的发展过程中,遇到问题、解决问题,用多种生物识别技术融合决策、多种技术解决一件事情。

我认为多模态是长期发展的一个方向。希望更多的创新者,在各自领域的单模态上,好好的创新、耕耘,大家一起为人工智能未来的发展创造一个良好的环境,谢谢大家!

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-12-09
眼神科技周军:十年一顾,再谈多模态
眼神科技创始人兼CEO周军莅临2019世界创新者年会并做演讲,他提出:“多模态”是AI技术的下一步,更是AI落地的必经之路。

长按扫码 阅读全文