近日,易观联合百度创新中心在长沙举办了《数据驱动下的企业创新之道》的线下主题沙龙活动,邀请到易观、自兴人工智能以及湖南领度的嘉宾大咖,以数据为名,以增长为义,为大家分享数据化实践经验。自兴人工智能CEO穆阳发表了题为《拥抱人工智能的黄金时代》的演讲,以下为其演讲内容:
我们知道人工智能的到来和现在的大数据是息息相关的,因为有了大数据才有了我们现在人工智能的广泛应用。这两年人工智能非常火,2017年比尔盖茨在北京大学做的演讲,演讲结束后有个问答环节,有人问“比尔盖茨你最感兴趣的是什么?”他说:“我最感兴趣的是人工智能。”“如果回到20岁你会做什么?”他说:“我会去做人工智能的研究。”我们中国在去年发布了《新一代人工智能发展规划》,提出了三步走,到2030年中国人工智能达到世界领先水平,人工智能产业规模达到一万个亿,带动相关的产业达到10万个亿,这也是习大大亲自将其上升为一个国家战略工程。
在2016年,AlphaGo战胜了围棋九段李世乭先生。很多人认为这是人类的失败,但是在人工智能的行业上来看,这是人类再一次超越了自己。上一次人类超越自己是什么时候?是在第一次工业革命,蒸汽机的发明,在力量上超越了我们自己。这一次可以说是在智力上超越了自己。人工智能借助了这个标志性的事件,把人工智能推向了舞台中央,为大家做了这样人工智能的普及课。
人工智能的发展历史
其实我们回顾历史去看, 1997年IBM深蓝计算机已经战胜了国际象棋高手卡斯帕罗夫,为什么这一次AlphaGo有这么大的影响呢?国际象棋的胜利靠的是深蓝计算机的计算能力,用得是穷举法,但是我们AlphaGo不可能再用那个算法,围棋的排列组合甚至比我们人类认知的宇宙中的粒子还要多,围棋是19×19的矩阵,它的排列组合达到多少?10的170次方,而目前了解到宇宙中的粒子是10的70次方。去年又有个新一代的AlphaGo元,它已经不再依赖人类的历史围棋数据,只是学习了围棋规则,然后自己跟自己博弈,自己跟自己下,经过很短时间的训练超过了AlphaGo。
我们已经一脚踏进了由人工智能所主导的ABC时代,A人工智能、B大数据、C云计算。过去十年、十五年是互联网和移动互联网的时代,正是由于互联网和移动互联网造就了海量的数据,有了海量的数据积累才有我们人工智能的发展。同时包括计算能力的迅猛发展,正是有了大数据跟云计算能力坚实的基础才有了我们人工智能今天的商业化落地。我们知道现在人工智能已经进入了各行各业,进入了千家万户。比如个人助理,举个例子,苹果手机上的Siri,你随时跟它说:siri,今天的天气怎么样?它会告诉你答案,这就是一个很简单的人工智能应用。
医疗领域,未来人工智能+基因技术一定会颠覆传统医疗,一定会引起医疗的革命。金融领域,各个金融的交易所,现在的金融交易员、金融分析师的人数越来越少,这些都会被人工智能所替代。还有政府、能源、交通(无人车)都在应用人工智能。未来人工智能一定会像水和电一样深入到我们生活的方方面面。
我们讲的人工智能会怎样跟人结合呢?会从最开始模仿人类,然后到辅助人类,最后到超越人类。研究显示未来有700种职业会被人工智能所取代,低价值的、高重复性的工作一定会被取代。举个例子,大家喜欢看NBA,比如说今天火箭和公牛在举行一场比赛,火箭以100比98战胜了公牛,姚明发挥出色得到了30分,15个篮板……都是这种模板化、数字化的,未来这种一定会被人工智能所取代,同理包括股票分析师未来也一定会被人工智能所取代。
人工智能从模仿人类、辅助人类、超越人类所带来的结果是怎样的呢?未来人工智能的机器,一定会从数量上、质量上超过人类。我们看这张图,一般人类的IQ一般是100左右,像爱因斯坦、达芬奇这两个大师他们的IQ达到200左右。全球著名风险投资人孙正义,在“世界移动通讯大会”上说:未来人工智能的IQ达到10000将成为现实,而智能机器人的数量(包括智能汽车)会超过人口总量。未来我们人工智能的IQ达到10000会是怎样?我们要分析一下人工智能的分类,目前人工智能有三大类,一个是弱人工智能,一个是强人工智能,一个是超人工智能。比如战胜围棋九段李世乭的AlphaGo是弱人工智能,那么什么是弱人工智能呢?就是用人工智能技术去解决单一领域的问题,李世乭版的AlphaGo它只会下围棋。强人工智能可以像我们的大脑一样,去解决各个方面的问题,可以开车,也可以下围棋。未来会发展到超人工智能,人工智能的智力大大超越人类的智力,甚至我们未来的人工智能在认知水平上跟人类已不处在一个纬度了。我们人类会学习知识、吸收概念、进行一个逻辑推导,去解决一些具体的问题,但是动物学不会,不在一个认识的层面上。
我们再来看看艺术领域,我来读一首诗:“人日不知处,工来有几时,智诗以为我,能世笑无言。”这是一首“人工智能”的藏头诗。这是谷歌举办的一次人工智能的画展,这里面的画是用人工智能画出来的。我们来听一段交响音乐,这一个人工智能的团队,让机器学习巴赫的曲风,编出来了一段。这就是人工智能,即使我们在艺术领域,创造性的东西人工智能也能够切入进去,当然这还只是一个弱人工智能,因为只是解决了一个单一的问题。
人工智能的整个发展历程。首先我们要了解什么是人工智能,简单来说人工智能就是让机器具备像人那样去认知、思考、学习,即用计算机模拟人的智能。人的思考,首先是知识的获取,然后基于知识和概念进行一些逻辑的推理,最终去解决实际的问题,机器正在学习像人类一样的思考。除了思考、学习还得让机器听懂这个世界,就有语音识别,语义分析,同时还得让机器看懂这个世界,就有了计算机视觉,机器视觉;还有让机器像人类一样运动,运动控制技术。人工智能有感知、决策、反馈三大块,我们拿无人车来举个例子,无人车上有很多的传感器,有激光雷达、摄像头等等,无人车首先需要感知周边的环境,前方是否有车、有人,除了车之外是否还有什么不明的物体,对周边的事物有了感知之后需要去做一个决策,这个时候利用传感器收集来的数据去做识别做决策。有了决策后再进行反馈,反馈产生动作。前面有个车或者人,我得立马踩刹车或者前面只是个垃圾袋,那我一脚油门开过去了。
人工智能到2016年已经有60年的历史了。人工智能之父也挺多的,有的人说是图灵,有人说是马文·明斯基和约翰·麦卡锡。在我们来看人工智能之父应该是图灵,图灵提出了这么一个模糊的机器智能的概念。图灵测试,让人类跟机器做一个交流,当这个人察觉不到是在跟机器交流的时候,那么说这台机器具有智能。
我们讲人工智能也是三起两落,在1956年经过了达特茅斯会议后,经历了两次低谷。为什么过去会经历这种波折呢,其实像1957年发明的Perception感知神经网络是的深度神经网络的前身,为什么会在那个年代里会跌入谷底呢?说实话,过去的神经网络都不能商业化、不能落地,为什么?因为在那个年代是没有互联网,没有移动互联网,没有大数据的支持。那个年代一个计算机装满一个房间,计算能力非常低,没有办法去形成产业化的落地。直到2006年,有了突破性的进展,进入了发展热潮。我们认为这一波会平稳向上。
人工智能的技术方向
为什么说这一波人工智能会平稳向上呢,我们来看看人工智能的三大要素:首先是数据,像深度神经网络这种算法是需要海量的数据去训练我们的算法模型,提升这个算法的精确度、提升算法的性能。正是因为互联网和移动互联网这么多年大数据的积累用于去训练算法,才可以把人工智能的算法做到更精确,数据就是人工智能的燃料,在未来数据一定成为一种新能源。第二是算力,随着并行计算能力、芯片技术的提升,大大提升人工智能的运算速度,降低了运算成本,算力可以比作人工智能的轮子。第三是算法,我们去解决具体的每一个问题,要靠我们核心的算法,算法是人工智能的发动机,正式因为人工智能具备了发动机、燃料、轮子这三大要素,所以我们相信这一波人工智能一定会快速的向前发展。
当然,每个行业兴起的时候,最大的瓶颈是人才。去年,我身边的一个学人工智能的应届博士,毕业了之后去了腾讯,他的年薪是80万。现在人工智能的专业人才太难招了,我们自己做人工智能招人也是非常的痛苦。我们自己建立的自兴人工智能学院也在为自己输送人才,自己在培养人才。其实目前来讲,大部分的人工智能人才来自哪里呢?很多是来自高校,Facebook的Yann LeCun,谷歌的Geoffrey Hinton,百度的吴恩达都曾是各自大学里人工智能研究领域里的执牛耳者。专业人才是目前人工智能最大的瓶颈。中国有人工智能专业的高校不到20所,湖南的中南大学智能系统与智能软件研究所是其中之一。
再来看看人工智能的热门领域,看看人工智能的技术方向,现在人工智能最火的是深度学习,深度学习技术是模拟人脑的神经网络去学习、去解决具体问题的。深度学习里目前用得最多的是有监督学习,有监督学习,是学习从A到B,从输入到输出的映射。我们知道人脑的神经元是有输入端和输出端的。举个例子,比如在营销广告上的应用,输入是广告和用户信息,输出的是这个用户会不会点你这个广告。
下一个是自然语言处理,各个大公司都在做智能音响。语音识别可以让机器听到我们的声音,自然语音处理除了像语音识别能够听懂,还得让机器理解这个事件。包括通篇文章的理解,就像我们学英文时有个阅读理解,阅读完一篇文章后,我们要能正确的回答后面的问题才能代表我们理解了这篇文章。加拿大的一个人工智能团队,让机器去读《权力的游戏》第五季的故事梗概,然后去问这个机器,:“是谁刺中了琼恩·雪诺”。“是守夜人”,AI 准确快速地做出了回答。
计算机视觉技术也是一个很热门的方向,像人脸识别,还有这个是步态识别,有人看过《碟中碟5》的电影没有?里面有这么一段,特工利用3D打印做了假面具,做了假的指纹、假的虹膜,都骗过了机器,但是最终在通过过道的时候,通过步态识别被识别出来,被抓住了。所以计算机视觉技术可以应用在智能安防领域。另外计算机视觉加上深度学习可以让机器认识一个图里面的各种事物,可以识别这是一个人这是一个风筝,这是一只狗。除了能够看到这些图片,还能看懂图片,比如看到这张图片后,它能理解,“一个人站在了一只大象旁边”。
刚才说过大数据是人工智能的燃料,未来大数据也是一种新能源。有了大数据还得靠算法去挖掘、去处理,只有通过好的人工智能算法才能让你的数据产生价值。未来到了物联网时代,万物互联的时代会产生更多的数据,到了那个时候需要更好的人工智能的算法手段去处理,让数据产生更多的价值。
人工智能在具体行业应用
首先讲医疗方面的,我们自兴人工智能智能研究和试管婴儿之母卢光琇教授深度合作,成立了光琇-自兴智能医疗联合实验室,主要是围绕医疗方面的相关领域做一些探索和产业化落地。医疗的领域应用场景比较多,虚拟助理,像我们现在看病,有了HIS系统,医生会敲键盘,把这个病人的病历敲进去,未来会是基于语音的,医生在跟患者的沟通中,利用语音的技术直接把他们的信息转换成文本输入进去。
医疗影像,目前在医疗行业应用得最广的,我们知道医疗的影像数据每年是40%多的增长率,但是影像科医生每年的增长只有2%,这里有个巨大的落差。人工智能技术可以很好的去填补这个落差。
辅助诊疗大家应该听说过IBM Waston吧。
还有疾病风险预测,基因是人类的代码,癌症本质上是一种基因病,是你的某一个基因产生了突变。现在可以做基因测序,把我们基因的序列测出来,未来更多的还是要通过人工智能的技术去解读基因,相信随着基因加人工智能技术的突破,大家都可以活到120岁。
药物的挖掘,一个新药的上市至少要十年的时间,投资过亿。这中间不断的做各种各样临床实验,利用人工智能技术可以大大的缩短我们新药上市的时间,降低成本。
还有健康管理等等。所有这些场景都离不开医疗大数据。医疗大数据有这么几个特点,数据量非常大,现在上升到PB级别了。种类也非常多,非结构化的数据(PDF、影像),半结构化的(XML),结构化的数据。医疗的数据的价值密度还比较低,这与我们当前医疗产业国家的现实情况相关,现在很多的医院,医院与医院之间,甚至在医院内部的科室之间数据是没有打通的,而且现在有很多医院的数据标准是不统一的,未来结构化的电子病例,一定健康大数据的基础。我们知道最开始的病历都是手写的,涂改三次之后这个病历要重新写,到后来有了电子化病例,未来会标准化、结构化。到未来医疗大数据还一定是区域化的,医院和医院之间的数据要打通,形成一个大型的数据库。
另一个热门应用场景是智能交通,现在很多巨头都在投入智能交通,投入无人车。无人车是一个人工智能技术高度集成的机器人,移动的机器人。它有感知、有决策、有反馈、有控制,能把无人车相关的技术处理好,你再处理其他领域的人工智能,我相信可能会是一个降维的空间。另外本身汽车行业是个非常大的产业,中国最大的两个产业一个是房地产,一个是汽车。
智能服务机器人,未来相信每个人身边都会有个懂你的机器人,未来一定是通过语音,通过我们的视觉,它甚至能够识别出你的情感,当你不高兴、不开心的时候它还会来哄你开心,未来会进入超人工智能时代。
人工智能中国机遇
我们再来看看人工智能这么火中国有哪些机遇?中国和美国是人工智能目前发展得最好的两个国家,我们中国的人工智能目前已经超越了日本、欧洲。来看深度学习领域的论文发表数量,我们华人的论文发表数量已经超过了美国,在人才、市场、政策、资本这几个领域里中国人工智能都具备优势,中国个理工科大国,中国普遍的数学基础都比较好,数学基础是学习人工智能非常重要的基础。市场方面我们中国有这么大的统一的本土化的市场,你看欧洲有那么多的国家,语言也很多,我们中国讲普通话,可以走遍全国。近年人工智能的政策也非常多,今年习大大的新年演讲,有人去看习大大的书桌上有什么书,其中就有两本是人工智能的书,人工智能已经国家的战略工程。这么火的行业怎么能少得了资本呢?这两年资本也在大量的投人工智能的行业。
我们再来回顾互联网的历史,互联网历史上电商平台eBay被我们的淘宝打败,淘宝是全球最大的电商平台。即时通讯最开始是MSN,最后被我们的QQ、微信所替代了,电子支付包括我们中国最大的支付宝。我相信未来在美国,在基础的芯片领域会保持一定领先,但是我相信在人工智能的应用市场上,中国未来一定会产生很多新的独角兽。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。