导语:
从军事到民用,如今进入工业领域,AR技术在寻找道路的阶段逐渐完善自我,也为开启第四次工业革命提供了一把钥匙。
亮亮视野通过“田野观察”找价值点,用“灯塔模式”在单个行业中逐步扎深,再回到战略层面的认知——吴斐认为,AR最重要的是连接了人和数据。
文|罗宁
编|王一粟
AR领域并不是一个新鲜行业,和很多技术经历的发展历程一样,其起初也从军用领域开始,但半个多世纪的产业变革,让这项技术逐渐迈入大众视野,而其中的每一步,都走的不像我们设想的那样简单。
1968年,世界上第一个头盔显示器“达摩克里斯之剑”在美国ARPA信息处理技术办公室诞生,这款大而笨重的军用头盔显示器最初的作用十分有限,且由于太重而无法移动使用,但人们第一次看到数字世界以一种完全不同的视角呈现在人眼前。
如同字面意义一样,“达摩克里斯之剑”最大的缺点在于重量,过于沉重的头盔不但无法让人四处佩戴,也让实用性大打折扣,但其内涵的概念却影响至今,正如发明者Ivan Sutherland博士在《终极的显示》一文中提到的那样,这是一个"观看虚拟世界的入口"。
随后的半个多世纪,当计算机技术、人工智能技术、互联网已经开始成为我们生活中不可或缺的部分,我们不但看到了这个虚拟世界,更是身处其中无法自拔,电脑、智能手机、智能音箱的普及让更多人意识到虚拟世界的力量,而AR技术也在这一时期迎来了自己的第一个高光时刻。
随着大洋彼岸的Google Glass以及HoloLens横空出世,无数普通人希望自己能够成为《头号玩家》中的一员,而随后的行业低谷期则告诉所有人,AR并没有大家想象中那样完美,它还需要时间,这时摆在所有从业者面前的问题是:
AR的真正价值究竟是什么?
带着这个问题观察AR行业的众多从业者当中,来自中国的创业公司亮亮视野找到了自己的答案。在行业低谷期成立,将目光瞄准工业和安防领域并取得成功,如今又在航空、能源、安防、建筑领域多点开花。
为何这家中国公司能够抓住AR行业的机会?又是如何能够在行业低谷时期迅速成长?带着这些问题,光锥智能专访亮亮视野创始人&CEO吴斐,也让我们看到一家中国AR公司的独立思考和成长轨迹。
技术回归与"田野调查"
2014年,亮亮视野成立初期,吴斐面临的首要难题之一,是当Google Glass这样关注度极高的产品出现在大众面前,一个新公司要进入AR领域,应该如何寻找切入点?为了回答这个问题,他将思考的重心回归到AR原点:
“最开始AR是在军用领域,在所有人都在做消费应用之前,AR是不是应该在工业、军事领域等B端、G端先产生价值?”
带着这样的结论,亮亮视野开启了最初的“田野调查”,他们组建了一个ODD团队(One Day Demo),每天做出一个应用场景,以探索AR和不同行业的结合,也在寻找一个突破口。在这个时候,医疗行业远程手术直播进入他们视线。
“在中国,医疗行业的优质资源稀缺,无法形成(需求)覆盖。”吴斐表示,对于医疗领域,AR能够为医生提供第一视角的宝贵资料,这件事的潜在价值巨大,团队也正好借此机会能够进入医疗健康赛道,亮亮视野成为“中国首个智能眼镜手术直播”的技术公司,但作为“田野调查”初次尝试,他也发现了切入这一行业的问题:
“其实主任做手术,他们只做最关键的步骤。手术时刀口是别人切的,止血是别人做的,准备工作做好以后主任再上来做,然后告诉助手要把哪里缝合哪里做处理,所以给他戴眼镜记录的第一视角并不是全过程。不是全程就没有什么意义,所以就给他助手戴,但记录下来的也只是助手的视角。”
在吴斐看来,这样的尝试“只是打了一个很小、天花板很低的市场”,但却依然让团队看到了AR在消费级市场之外的可能性,并认识到光学、AI技术对AR公司的重要性。
蓝驰创投董事总经理曹巍就提到,亮亮视野在早期就开始对AI算法和光学研究进行投入,这种技术底层积累对创业公司的长期发展影响深远:“AR在底层技术上有两个分支是非常关键的,一个是光学研发能力,另一个是基于AI在特殊场景的算法模型优化和研发能力。亮亮视野和中科院自动化所、浙大光电学院,通过深度合作的方式联合研发突破一些前沿难题,再把它放在业务实践里去完成,这也是很关键的底层技术积累。”
这样的积累带来了产品力上的提升。面对AR头戴设备笨重、发热量大、运算效率低等问题,亮亮视野一方面将部分运算处理任务转移到手机以降低眼镜重量,另一方面率先将英特尔Movidius Myriad 2芯片应用于智能AR眼镜终端,使其相较于过去具备更强的计算能效比,从而更好控制机身发热。而在镜片上,追求超清、超薄、高透光性、零漏光的阵列光波导技术成为其研究重点,并在之后实现了规模化量产。
这些回到AR技术原点的“基本功训练”,不但提升了亮亮视野在产品上的优势,也为之后的“田野调查”提供了更多可能。
安防是一块巨大的万亿市场,也让亮亮视野看到了新的可能。
在人流量巨大的火车站、机场,亦或者是车水马龙的交通要塞,如何快速甄别犯罪嫌疑人?结合人脸识别的AR眼镜便能实现。在任务执行期间,AR能为民警显示叠加在眼前环境中的3D信息,快速比对数据库,不仅提升办案效率,也能降低操作失误。
四川省雅安市荥经县当地警方在从2018年起开始,采用基于亮亮视野AR技术研发的“禁毒稽查路控系统”来完成来往车辆人员的甄别。民警只需要佩戴一副AR眼镜,朝车内人员和车牌看上一眼,便能在信息库里快速比对是否有犯罪记录或吸毒史等相关信息,随后显示在和眼镜相连的手机上,误识别率只有千万分之一。
这一过程相比过去的问询盘查,从5-10分钟时间缩短到到1秒左右。对于民警来说,更快更准确的检查意味着更高的办案效率,在AR眼镜以及AI技术加持下,原本看起来繁琐的过程变得有些 “科幻”,让罪犯难逃法网。
“我们把自己定位成企业服务专家,这里面关键是服务。怎么理解服务?就是要在每个关键点都要打通,去做AR技术的改造和创新,把专业知识形成数字化的解决方案。2016年都在说‘聚焦’,我们需要先去打通场景,再从场景跳出来去思考怎么做更具广泛性的平台。”
先思考战略,指导战术落地,再回归战略。这种模式让亮亮视野不仅建立起基于AR交互的多个新场景,并延伸出了AR技术的应用边界。
吴斐提到,当这一阶段之后,亮亮视野更明确自己的定位:“亮亮视野(的产品)不是一个硬件,而是一套完整的系统,是建立在知识图谱和AR交互上的应用。”
从场景出发做技术创新
AR领域一直存在着“AI一思考,眼镜就发烫”的说法,作为深度融合AI与AR技术的前端产品,AR眼镜不仅仅需要企业对光学领域持续不断进行基础投入,也必须将AR、AI和具体场景结合的底层场景持续挖掘,即便是最有经验的谷歌和最有资源的Magic Leap也还不能在这两方面同时成功,那么亮亮视野的秘诀究竟是什么?
从使用场景出发,亮亮视野把解决轻量化问题放在了核心。轻量化的实质是将一台支持AI技术的计算机塞进几十克的眼镜中,要在保证性能的同时降低发热,尽可能让佩戴者长时间使用——这对于产品的研发是一项巨大考验。
因此,来自英特尔的Movidius Myriad 2芯片才会出现在亮亮视野的AR眼镜上,作为最早吃螃蟹的公司,这款芯片成为亮亮视野“破局”轻量化的重要一环。这颗只有9.5mm*8mm的VPU拥有相对传统CPU架构5倍的计算能效比。目前这颗VPU已升级到Movidius Myriad X ,可提供每秒万亿次的计算性能,功耗却不到1W。
但仅靠VPU硬件提升计算能效比还不够。尽管Movidius VPU硬件相对成熟,但其工具软件链不成熟,一些关键算子的运算效率较低。亮亮视野团队基于Movidius VPU硬件自主研发了Laffe引擎,对关键算子进行汇编级优化,部分算子比英特尔官方实现速度快了2-10倍不等。采用VPU硬件和Laffe引擎软件加速,亮亮视野获得了相对于CPU的15倍计算能效比提升。
为场景不断升级革新的另一个突破在光学部分。2020年5月,亮亮视野发布并使用上了超短焦AR光学模组“八面体”。这种超表面技术不但将光学模组重量降低至9克,还实现了低功耗、高透光率以及零漏光。当技术落地,亮亮视野第一时间发布了Leion Pro这款产品,其85%透光率、4000nits最高亮度、10000:1对比度、3600PPI、100%sRGB、<1mm透视偏差成为行业领先,都让亮亮视野打开了更多使用场景。
“AI要从底层改造,需要重新考虑产品功耗和性能比。从人、场、物的识别,再到未来的数字孪生、知识图谱的构建。未来AR技术会以‘知识渲染’的方式来让使用者感知现实世界。”吴斐表示,亮亮视野把产品创新和场景探索深度融合在了一起,这也是目前其多个产品线并存,覆盖十多个领域去进行服务的原因。
以上这些场景,仅仅只是AR扩展场景的其中一小部分,伴随AR设备轻量化和更快算力的加持,新的AR设备将能脱离网络,在离线时继续工作。亮亮视野的产品已经真正实现了从目标检测、追踪到识别,所有AI计算都部署在眼镜终端运行。吴斐透露,以安防中的多人脸动态识别为例,这样部署计算能够保证即使在通信网络中断的情况下,AR眼镜仍能通过完全离线的方式执行人脸识别等基础任务,响应时间则在毫秒级别。
伴随场景的深度学习算法升级也是亮亮视野可以切入企业服务,快速落地生根行业应用的“杀手锏”。近年来深度学习在计算机视觉领域的应用已经非常成熟,也已经成为AR眼镜产品的标配。亮亮视野团队采用剪枝、蒸馏等技术对冗余的算法模型进行压缩。依托VPU和Laffe框架,利用神经网络压缩技术,对具体算法辅以针对性改进,实现了AR眼镜上计算能效比的大幅提升。以人脸识别算法体系为例,亮亮视野团队一共约取得了相对CPU计算基准的50倍计算能效比的提升,从而在低功耗的AR眼镜上实现了AI算法实时运行。
在吴斐看来,十年前iPhone刚起步时或许存在很多不成熟,但其创新之处在于找到了成熟技术和场景结合的变革可能。已经半个多世纪的AR产业也是如此,如今在技术上,目标识别、远程协助等其实都已成熟,但如何创造与革新才是行业重点。“让很多功能跑到一个这么轻的并行计算平台,如何在这上面用更小的模型实现,到底解决了哪些问题,我们都要踩着基础技术的肩膀往前。”
正因如此,修炼好内力的亮亮视野,才得以在一次次场景服务中发现用户痛点并加以解决,从而真正通过硬件创新解决了客户面对的技术挑战、安全挑战、效率挑战等一系列问题,在改造与创新背后,技术服务场景的价值才被越来越多人关注到。
螺狮壳里做道场
Facebook AI研究院首席AI科学家Yann LeCun曾指出,“AR眼镜有机会成为机器学习从业者的理想挑战目标,因为它涉及许多尚未解决的问题。在低功耗的AR眼镜里实现高效的AI运算,颇有些螺狮壳里做道场的意味。”
要在螺蛳壳里做道场的亮亮视野,在2017年迎来了其商业领域的重要合作——与优信打造二手车检测业务,谈到这次合作,吴斐认为他们看到了AR在B端市场的真正价值:
“优信希望每个员工都能像最顶尖的汽车专家一样去思考去检查。因为检查一辆车,怎样能在15分钟看出进没进水,维修过没,撞过没,都是最初存在于少数人的意识经验里,这是很多优质专家的技能,他们可能看了几眼就比别人更能判断出车况,但怎么把这种知识结构让其他人掌握,这其实是AR应用领域真正的知识图谱1.0,就是要把人的知识挖掘透彻。”
对于亮亮视野而言,与优信合作不但变革了过去专家传授经验的方式,更重要的发现了人与车产生数据的潜在价值。
“当产生几百次这种真实数据之后,优信反过来发现这可以用来评价人和车。比如人的效率高不高,是不是在检查中作假了,这成了评估人的业务能力的一个参考;另外车也可以判断,比如哪些车很快卖出去了,就能判断车的销售和车况关系,输入输出如此完整,这个数据就为优信建立一套完整的评估体系提供了基础知识数据。”
对于民航、工业、建筑、汽车等行业来说,积累系统知识,建立知识图谱至关重要。企业中高级人才变动往往意味着知识流失,如何把这些经验和知识加以保留,AR与AI的结合为他们提供了答案。AR设备在远程协助上的优势,可以帮助新手快速学习专家的经验,另外一方面,即便一些资深专家退休,AR设备的存在也能直接将他们带往现场,这在过去也很难实现。
图灵的老师维特根斯坦在他著名的《逻辑哲学论》里写道:“世界是事实的总和,而非事物的总和”,这其中的事实是事物之间的关联。过去人们在生产实践中对于这种关联的把握更多需要依靠实践积累,而AR的数字化变革将专家经验更进一步转化为知识图谱,并和人工智能深度融合,最终成为许多企业源源不断改进和创新的知识积累,以此为基础,亮亮视野从汽车检测扩展到飞机检测,实现了和业内多家一线民航企业的重点合作。
“当我们把车换成飞机,把车检员换城机检员,有了AR这种知识图谱方式,很多人第一次感受到了这种把人和知识连接在一起的力量。比如民航企业检查飞机之后,能知道谁检查更快、谁检查慢,能立即知道这个飞机是不是静电刷特别容易掉,飞到哪条路线上特别容易被鸟撞,这些都可以在以后检查的时候实时看到最新数据,这是打动对方的地方,他们看到了数字化转型的价值。”
亮亮视野在民航领域的探索,也成为其商业实践中“灯塔模式”的标志性事件。
“第一期的产品更多用作在机场远程指导作业,并把过去的标准工作AR化。然后发现,有许多在实际磨合中产生的改进和新增需求,比如远程指导时,后台专家看时间长了会头晕,那我们就需要做新的算法来防抖;而在有些关键节点上,专家也希望能看到一线人员是否真的把工作做好,比如一些螺栓是不是真的拧紧,这些事情我们就用AI来验收。我们专门拿出一部分预算来做训练,用迁移学习的方法可以训练到一个非常高的准确度,下一阶段的目标就是所有验收的工作都能让AI完成。”
“当把所有验收、作业指导做好之后,我们从数据的外延看该怎么去和机型做连接,该怎么和每一次飞行任务连接,怎么和人的能力等级、和主管连接起来。于是,我们开始做预测修型AI,如果某个一线的人突然换岗,那之后的人要怎么做?我们想让一线员工都能成为非常聪明的操作者。第三期的目标是把机务打通,目前来说还是在连接阶段。”
吴斐提到,与民航公司的合作项目一共进行了三期,前期三个多月探讨中,大家对于AR能做的范围一直在扩展。一期做完团队对二期的理解马上和做一期之前不一样了,当二期做完团队已经知道三期应该怎么调整,而这次合作也让亮亮视野发现了AR在民航领域的巨大市场,最终,亮亮视野准备为这一领域带来更全面的解决方案并推向整个民航业。
“最开始以为这只是个别公司的需求,后来发现整个航空领域都是如此,所以为什么最后我们把目光聚焦在AR行业灯塔,就是发现这一类项目还是不要太着急,AR的终极答案远远超出我们想象,应该先专注于当下这些项目把它做实做透。”
这次合作,也让亮亮视野看到中国工业数字化转型背后的庞大市场需求,在吴斐看来,中国在很多领域对于AR行业的需求都像这家民航企业这样切实存在。而伴随对这些行业的深入合作,更多中国企业有机会成为具有世界级影响力的品牌,“今年中国民航客流量已经是世界第一了,以现在的投入来看,很快就会走到世界前列”。
让AR服务于所有人
从二手车到航空,从安防做到建筑,不断发掘AR与AI结合的更多可能性,让亮亮视野看到了AR切入B端的潜在价值。通过基于“渲染的显示技术+感知技术+基于场景的AR知识图谱”的三步走战略,亮亮视野也逐渐建立了在AR领域的行业壁垒。
蓝驰创投执行董事曹巍表示,亮亮视野在嵌入式人工智能算法和光学底层技术研发方面的成果,帮助公司建立起了更长期的综合技术壁垒。在光波导显示和嵌入式人工智能算法方面,亮亮视野都已实现关键突破,并成为全球范围内在该领域落地应用的样板。在业务拓展方面,工业场景已经进入到规模化放量阶段,安防场景实战效果显著,民航市场也已经开始加速拓展。
但对于成立7年的亮亮视野而言,AR比赛的上半场依然没有结束。
大洋彼岸,微软和谷歌开始转换思路进入工业、医疗、安防等领域。微软不仅与福特达成合作,让工作人员可以借助HoloLens将整车变成3D可视化的全尺寸模型,还在今年4月1日拿下美国军方的AR设备订单,将为其提供超过超12万台HoloLens,总价值最高可达218.8亿美元。谷歌则在雪藏项目两年之后推出Glass Enterprise Edition,这正是企业版谷歌眼镜,合作方不乏DHL、三星和大众汽车这样的大型公司。
另一边,天风证券郭明錤也曾在3月发布预测报告称,苹果或将在2022年中期推出AR/MR头戴装置。该装置不仅拥有高清晰度显示屏,还将配备眼球追踪系统,能够实时运算AR/MR所需影像/图像/信息。就在4月5日,苹果CEO蒂姆·库克接受《纽约时报》采访时也提到,AR对苹果的未来而言是极其重要的一环,在库克看来,“无论是健康,教育,游戏,零售,已经能看到AR开始在其中一些领域起势。”
行业巨头加入战场,产业链正在逐步走向成熟,但对AR基础领域的研究却更加必不可缺,一是产业链的成熟将带动成本降低,从而促进商业化落地,而对中国AR产业来说,卡脖子问题不能重蹈芯片的覆辙。
中国在AR/VR领域的推动力度在不断加大。2020年11月9日,《国务院办公厅关于推进对外贸易创新发展的实施意见》指出,利用新技术新渠道开拓国际市场,充分运用第五代移动通信(5G)、虚拟现实(VR)、增强现实(AR)、大数据等现代信息技术,支持企业利用线上展会、电商平台等渠道开展线上推介、在线洽谈和线上签约等。在吴斐看来,亮亮视野做的事情和中国数字化进程是同向的:
“航空公司用AR去做检修,其实就是通过数字化转型去带动AI人才和工业整体的提升,这是国家愿意在新基建上面投入巨大的资源,同时让工业GDP的22.5%用于数字化转型的投入。一头拉一头推,这才是我认为未来十年科技企业大红利的点。AR真的能发挥作用,因为新基建本质上是信息化到智能化的过渡,数字化转型就是企业的产品业务都以数字展开,所有跟“人”相关的结合必须有新的手段。”
面对数据和人如何协同升级的难题,二手车、民航等领域找到了AR这样的解决之道,但依然有许多企业亟需进行升级,这需要更多亮亮视野这样的公司共同探索。
根据IDC预估,2021年全球将售出不到100万台AR眼镜和头戴设备,但到2025年,预计销量将增长到2340万台,这其中企业客户将占总销量的85%左右。广发证券研究团队此前也提到,5G时代到来有望大幅度改善硬件之间的协作,从而进入硬件的泛智能化时代,以AR为代表的新型硬件有望获得快速成长。
从田野观察中找价值点,到灯塔模式逐步扎深,再回到战略层面的认知——吴斐认为,AR最重要的是连接了人和数据,让知识得以更快速在虚拟与现实之间流动。AR技术看似技术为人服务,但最终人也在产生新的数据和价值:
“我们早期是在为客户把最佳实践变成知识,把人的知识变成数据,把知识链和知识图谱给到一线,这反过来其实就是知识图谱通过数据再次升级的一个过程——从数据到人,人又回到数据,最后变成知识。”
5G技术的“效率驱动”效应同样不容忽视。国家信息中心信息化和产业发展部主任单志广提到“5G技术的大带宽、低时延、广连接、高可靠等特点,不仅加快了网络速度,也将终端全部纳入网络,实现“万物皆可联”的状态,对传统应用带来深刻的效率变革。”
而在曹巍看来,这对包括AR/VR在内的诸多应用落地起到了重要作用,“5G高带宽,低延迟以及工业分片这三个核心特性让AR有了更大价值。很多过去需要前端运算的事情,现在可以不用在终端上运算,这就减轻了终端的计算压力,也减轻了终端的能耗,从这个角度来讲,5G和AR的结合能在工业、安防、建筑方面能显著降低成本,因为不再依赖昂贵的CPU去做边缘计算,而工业分片可以让5G在区域内高速推送运算结果,基于4K甚至更高清的视频共享和调度就有了保证。此外,基于云端的应用、云端协同等体验也会显著提升。”
在吴斐看来,如今AR行业再次受到关注,在于它打通了人与数据连接的“最后一厘米”,这将是下一个数字化变革的关键。
当风口再来,虚拟和现实世界正在不断交融。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )