最近几天,GTC 2017(第八届GPU技术大会)的热度再一次引爆了全球科技圈的关注,VR、Volta、超算、GPU云服务、自动驾驶芯片、以及机器人训练等众多前沿技术简直让人眼花缭乱!不少媒体圈的朋友也和老冀讨论起这些技术,我们惊讶的发现,这些技术均有着一个共同特征:AI(人工智能)和深度学习!
GTC 2017主办方“AI 计算公司” NVIDIA联合创始人、CEO黄仁勋在持续两个多小时的Keynote演讲中,自始至终都在围绕一个关键词:“AI”。谁都不能否认,人工智能的时代已经到来,而这不仅仅是科技的变革,也将最终会因让人类的生活变得更美好而演变成一场社会发展的变革。人工智能将成为互联网之后,再一次彻底优化人类生产、生活的核心驱动力,对人类社会的未来、经济的未来、文学艺术的未来、人类全球化的未来产生深远影响。
“人工智能的核心突破来自于深度学习。”专注于计算机视觉和深度学习的AI领军企业,商汤科技联合创始人、CEO徐立博士表示。这家公司曾在2016年凭借1207层深度神经网络成为当前在ImageNet上最深的一个网络,而获得目标检测、物体检测和场景分析三项视觉识别冠军。
在今年的GTC 2017现场,商汤科技则展示了更多成熟、体系化的基于深度学习的人工智能计算机视觉解决方案,与IBM、亚马逊、思科等国际著名科技公司同台争艳。徐立表示:“人工智能核心技术的运用在未来将渗透在金融、移动互联网、安防监控、工业制造、无人汽车等众多领域,而每个细分领域都将对人类生活产生巨大影响,让人类生活变得更美好。”
AI,让艺术创作走向大众
在机器的世界,哲学和艺术可能是最难以理解和模仿的人类“技能”了,因为太抽象,机器很难以逻辑化的语言来对目标进行解读。不过,人工智能和深度学习就仿佛为机器打开了伊甸园的大门,让机器也拥有了创造艺术能力,进而让机器的使用者——人类进行艺术创作更加简单。
也许你会感到惊讶,但人工智能技术在视觉艺术上的应用确实已来到我们身边。在GTC 2017现场,商汤科技展示的SensePhoto全面手机影像处理解决方案,就为机器赋予了艺术创作的能力,让普通大众也能够通过手机,就能拍出类似于专业单反相机的照片效果。
SensePhoto借助基于GPU的深度学习引擎,通过包括实时深度计算、超分辨率、图像增强等软件算法,让智能手机“傻瓜式”的操作即能实现背景虚化、先拍照后对焦、暗光拍照、光学变焦等应用。目前,这一技术已广泛应用于多个位列中国前十大手机品牌的手机产品中,相信你一定也感慨于中国智能手机的拍照功能越来越好,拍出的照片越来越美,越来越多的人都喜欢在朋友圈里晒自己拍摄的“艺术创作”了。
此外,人工智能计算机视觉技术也更多地渗透进智能手机APP应用中,为用户带来更多娱乐化的体验。借助Faceu、SNOW、小咖秀、熊猫直播等多种APP,用户可以体验到趣味面部贴纸、变脸乃至动作增强、背景替换等众多有趣的功能,而这些应用正是采用了商汤科技SenseAR实时视频中AR特效生成解决方案。SenseAR结合了全球领先的人脸检测及追踪、106个人脸关键点定位等技术,基于手机摄像头,可进行脸部、手势、前背景的跟踪定位,并进行增强现实感特效的内容绘制,在娱乐、教育等诸多领域均具有巨大的应用潜力。
AI,让未来生活更加便捷
技术不仅仅是技术,技术的未来必将为人类的生活带来更多便捷和不同。互联网技术的应用,已经让大家实现了足不出户点餐吃饭、高效快捷的网络购物和无现金出行。而具有深度学习能力的人工智能技术的加入,将让人类的生活实现更多此前无法想象的改变。
在本届GTC 2017上,商汤科技还首次展示了SensePose单目摄像头实现人体动作估计产品,可识别10个像素以内的人体关节,能够在视频中实时、准确地识别人体姿态,定位手、肩、脚、腰等十几个关键点位置,可广泛应用于AR、VR、安防、娱乐游戏等领域。
SensePose最大的特色即是将成为人机交互、虚拟穿戴、虚拟试衣等应用的决定性技术。通过这一技术,人们网购衣物不会再有收到后不合身、效果不满意而退货的情况,节省大量物流资源;通过这一技术,人们将更高效的实现与机器对话,让机器更精准的理解人类的动作和想法;通过这一技术,与人脸预测技术相结合,还可用于描述视频中人物关系或人物状态,从而实现视频内容的理解和分析,为影视行业创造更多商业价值。
AI,让智慧城市更安全高效
新型智慧城市建设是新技术和城市治理理念的深度融合,需要通过众多的先进信息技术来实现智慧式管理和运行,智能视频便是其中之一。而目前,我国城市建设中所涉及的视频大数据处理和分析仍需借助大量人力完成,执行效率低下。如涉及到安全领域的人脸监控,很多市级公安局还主要通过人海战术进行比对,专门从事人脸图像搜索的图侦人员就超过400人,并且对于很多模糊图像、暗光、噪声、多角度、遮挡等图像特征较差的素材提取能力没有保证。
而人工智能计算机视觉的能力优势非常明显。一方面,在感知上,机器比人眼更加敏锐,能取得比人眼更多的信息,图像识别率比人类更高;另一方面,机器在理解层面,甚至能超越人类作出一些更有创造性的活动。GTC 2017上,商汤科技公开展示的SenseVideo视频结构化系统和SenseFace大规模人脸布控系统,就分别在城市路面、车流状况动态分析和城市安防领域迅速取得突破,为城市安全和管理提供技术协助,提升城市运行效率。
SenseVideo视频结构化系统,是商汤科技在全球权威的计算机视觉竞赛ILSVRC 2016中获得场景分析第一名的深度学习模型的实际应用成果。该系统拥有行人检测、车辆检测、车辆分类等多种技术,可以在监控视频中按照时间和地点,实现人、非机动车和机动车的检测、跟踪、抓拍、检索及数据统计和分析,为路面状况动态分析、车流密集地段识别、街面安全时段分析提供强大助力。
而基于全流水线的深度学习算法的SenseFace人脸布控系统,可在光照、角度、表情、遮挡、年龄变化等情况下保持超高的识别准确率,在千万级人员库中300ms内获得比对结果。SenseFace支持1000+路监控视频中实时检测、跟踪、识别人脸,并支持在数十亿级人脸抓拍库中进行轨迹还原、案件碰撞等实战应用,实现事前、事中和事后的人脸布控和信息挖掘,成为刑侦、治安等业务部门有效的高科技办案工具。目前,SenseFace系统利用超越人类的人工智能技术,已帮助各地抓获了上百名犯罪分子。
AI,让理想更简单;AI,让生活更便捷;AI,让城市更智慧;GTC 2017上,商汤科技及诸多科技公司为我们展示了一副人工智能未来应用的美好图景,也深刻地向大众传达一个声音:AI,将让未来充满无限可能!
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。