在顶尖学术会议中成功“刷榜”,一直被看做是AI企业实力的绝对证明。尤其是在AI研究创新涌现、几大顶会迎来“论文大爆炸”的背景下,学术竞争也愈加激烈,想要“出人头地”,真不是件容易的事。
最近在全球计算机三大顶级会议之一ECCV 2020上一举拿下8个赛事冠亚季军大奖的深兰科技,彰显实力。
而且,深兰科技也在Kaggle平台上举办的ECCV挑战赛Google Landmark Retrieval 2020上斩获金牌,在计算机视觉模式识别会议CVPR2020中斩获了12项冠亚季军,在国际计算机视觉大会ICCV2019竞赛中拿下“四冠四亚一季”的成绩……各种优异成绩的井喷,显然不是偶然。
我们知道,计算机视觉是当前人工智能学术界非常活跃的研究领域,而ICCV、CVPR、ECCV这计算机视觉方向的三大顶级会议,更是云集了谷歌、斯坦福、BAT等等科技巨头,被中国计算机学会评为最高级别学术会议。
在这样的“学术修罗场”能够拿下挑战赛的大满贯、取得多个第一的战绩,深兰科技的技术底蕴与含金量不容小觑。
初看结果,读者们可能会很诧异,深兰科技到底做了哪些创新,又对当下乃至未来一段时间的AI研究带来怎样的影响?
沿着这些问题思考,或许我们能对AI技术与产业逻辑,有更深一层的理解与认知。
深兰科技的创新成绩单
既然是硬核学术会议,自然还是成绩说话。我们先来看看深兰科技在三大顶会拿奖到手软的各种创新算法,究竟都在做什么。
就以此次ECCV为例,深兰科技获得双冠的GigaVision 2020挑战赛,是由清华大学基于其新推出的数据集PANDA而组织的。
PANDA是全球首个十亿像素级别视频数据集,在如此大规模的数据集上完成图像多类别目标检测,既要保证算法能够在目标尺度变化、拥挤遮挡的复杂情况下准确地识别出行人和车辆这两种不同的目标,还要保证足够高效,在十亿像素级别分辨率下快速完成。
显然,这一任务的完成,能够对大规模现实场所中的行人检测、动作识别、异常检测等带来技术上的飞跃,让人脸识别、无人驾驶、监控安防等应用结果更准、效率更高。
而针对技术上的难点,深兰科技DeepBlueAI团队在检测赛道将任务解耦为多个子任务,把难点独立出来重点解决,并根据以往检测经验,通过所积累的模块和方法,使得结果有了进一步的提升。最终以领先第二名2.6个百分点的成绩强势获得冠军。
在其他类目的挑战赛中,深兰科技DeepBlueAI团队相继完成了基于部分MSCOCO数据集来进行80个类别目标检测的小样本学习任务;在不使用任何预训练模型从头开始训练的限制下,在ImageNet的子集上获得最高的准确率;运用优化数据增强方法、特征提取器、后处理等方法,对无人机视角拍摄的图片,完成车辆、行人等目标的定位分类……
上述成绩,都只是深兰科技2020年研究成果的一部分,也是其技术积淀和底蕴的又一次佐证。
实际上,在ICCV 2019,深兰科技就曾在VisDrone Challenge (无人机视觉挑战赛)中,运用Cascade RCNN+DCN+FPN+DoublueHead检测器,以及IOU Tracker+ KCF+Tracklet vote的跟踪算法,来解决部分目标过小、数据分布影响预训练效果等难题,最终以领先4个多百分点的巨大优势获得两项冠军。
CVPR 2020的NightOwls 检测挑战赛,也为参赛者们设置了不小的难题。现有的视觉检测算法不能很好滴解决夜间场景图片中的行人,这无疑会给无人车夜间行驶的可靠性、监控安防的安全性能等都带来了一定的限制。
所以NightOwls就开展了相应的比赛,而深兰科技也顺利在 “单帧行人检测”和“多帧行人检测”两个赛道中拿下了冠军。夜间行人检测与白天行人检测相结合,能够打造适用于不同天气条件、全天候的行人检测系统,让现实世界的出行安全更有保障。
关于深兰科技在数个AI顶会上的创新表现,我们就不在此一一枚举。可以肯定的是,深兰科技作为中国AI企业的代表,在顶会竞赛中大放异彩,不断向全球传达和证实着中国AI力量的实力,达到了世界领先水平。
深兰科技的学术+产业“双循环”模式
大家可能会好奇,在计算机视觉这一竞争激烈的赛道上占据技术上的多方位领先,深兰科技到底做了些什么?
这恐怕就要从深兰科技的业务逻辑说起了。
我们知道,2017年开始的人工智能资本热潮,带动了一大批AI企业的涌现,大致可以归为两类:
一种是专研算法的技术型企业。其核心资产是算法、数据等能力,需要引入深度学习领域的高级人才,大量投入底层算法研发与创新,常常需要跟谷歌、微软、Facebook这样的科技巨头“抢人”。尽管投入巨大,但也正是这一类企业推动了人工智能底层技术的不断精进,而一旦达到规模效应,就很容易占据行业领军者的位置。
而另一种则是产业升级的应用型企业。商业逻辑也很清晰,就是向算法供应商购买技术,通过自己的工程师团队将其打磨成体验良好的成熟AI产品,借助自身的服务能力与销售渠道将解决方案售卖出去。
而有意思的是,深兰科技走出了一条独特的路。
借用2020年十分火爆的一个关键词“双循环”来形容,深兰科技一边在各种AI顶会上寻求技术上的系统性、基础层面的领先,一边带动AI技术落地应用、服务民生,开辟了一个“基础技术+产业联动”的双循环模式。
举个例子,前面提到深兰科技在CVPR 2020各个挑战赛中提出的多项检测与分类算法,就被落地应用在了智能熊猫公交车等产品上,让公交车自主制动和运行,为城市公共交通提供了新的选择;乘客扫手就能上车,体验和效率都大大提升;智能机器人还能感应驾驶员和安全员的实时状态,最大程度地保障乘车安全;借助关键点检测打造“异常行为识别系统”,车厢内有人摔倒、偷盗等情况都可以及时告警……
再比如,智慧城市建设中部署的许多商业化摄像机,难以在恶劣天气下保持比较稳定的识别准确率,给城市管理带来了很多隐患。深兰科技夺冠的“挑战赛雾天条件下的(半)监督目标检测任务”,恰好就针对这类问题,让摄像机在恶劣天气环境或光照条件较差的情况下,依然能够很好地完成任务,让深兰科技的客户或集成其算法的企业能够更好地使用AI。
今年春节期间,面对防疫工作中的测温刚需,深兰科技快速上线的AI热感视觉行为监控系统——猫头鹰,就融合了多种世界冠军级技术,采用了红外热成像技术和自主研发的机器视觉算法,深度融合红外和可见光图像,人们只要进入被测温范围就能实时测出体温,无需停留,在防疫的同时大大方便了出行。而能如此快速地打造出服务社会的刚需产品,显然离不开深兰科技将长期的技术积累与产业需求深度整合的能力。
正是这种底层研发突破与产业标准化落地的双重效应,让深兰科技在学术竞赛中彰显实力的同时,也很快将先进算法落地,借由产业化的规模效应实现商业价值,再进一步推动AI技术的进步,进入自身发展的良性循环。
行稳致远,未来可期
一边是技术创新,一边是应用落地,深兰科技显然选择了一条更难走的道路。大部分人可能会问,有必要吗?
比如直接售卖算法或者解决方案,深兰科技始终坚持基础研究和应用开发双落地的模式,可能并不讨巧,却成为中国AI形成差异化优势的关键巨助力。
将视角放在全球技术竞赛的大背景下,会发现中国AI依然需要在基础研发上加速追赶。
北京智源人工智能研究院发布的《人工智能下一个十年》中就提到,在AI全领域,2009-2020年期间全AI领域被45个顶会和顶刊录取论文数据显示,中国学者量和论文量都约为美国的1/3,十年间美国AI论文量超出中国4万多篇。
想要拿下全球顶尖的技术桂冠,最根本的是要提高自身的创新能力。从这个角度看,像深兰科技这样不断向基础研究发起冲锋的科技企业,正在建构起中国AI未来十年的竞争“天顶”。
另一方面,如火如荼的新基建热潮背后,要解决各行各业、不同场景下对算法精度、性能的要求,在信息化不足、数据缺失等传统行业完成智能化改造,更需要领先算法来保驾护航,完成与产业端的深度整合。
如果说技术能力是舟,那么对产业应用的重视与探索就是桨,帮助AI更平稳地驶向大海。
舟楫相配,得水而行——或许是深兰科技带给我们对未来最美好的想象。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。