FBEC2023 | Rokid副总裁 & XR中心负责人 王俊杰:Rokid,开启空间计算全球化时代

FBEC2023未来商业生态链接大会暨第八届金陀螺奖于2023年12月8日在深圳福田大中华喜来登酒店6楼盛大召开,本次大会由广东省游戏产业协会、深圳市互联网文化市场协会指导,陀螺科技主办,中国光谷、游戏陀螺、VR陀螺、陀螺财经、陀螺电竞联合主办。

大会以“合力共生·韧者行远”为大会主题,以具有行业前瞻洞察的“航行者”为视角,破冰之旅为主线,关注AI、元宇宙、XR、游戏、电竞、数字经济等科技与互联网前沿领域,全方位呈现科技前沿成果,聚焦时代与商业热点议题,探讨新科技、新商业、新模式的未来价值,与真正的勇者共赴剧变革新下的凛冬破冰之旅!

FBEC2023主会场B:乘势而上,稳舵远航——2023全球VR/AR产业与空间计算论坛邀请到Rokid副总裁 & XR中心负责人 王俊杰带来主题为“Rokid,开启空间计算全球化时代”的精彩演讲。王俊杰认为,我们正在经历一场信息流从二维的手机电脑展示,到空间展示的信息革命。在未来,每一寸空间都可以自由定义数字内容。

图片1.jpg

以下为演讲实录:

大家好,我是Rokid王俊杰,很荣幸受主办方邀请在此进行分享,我的分享主题是《Rokid,开启空间计算全球化时代》。

前面案山子老师提到过,在这个时期,整个XR行业都在蓄势待发,Rokid也是。Rokid是一家隐藏在精美硬件产品中的系统软件公司。为什么这么说?因为从2014年成立开始,Rokid就聚焦于市场需求,从场景、软件出发,定义不同硬件产品的迭代。满足不同的市场领域,涵盖To B和To C等各个时期的眼镜产品。在整个产品研发的过程中,我们夯实技术基础,在系统技术、语音识别、图像识别、光学显示、交互技术等技术领域构建了独立自主的研发能力。

回到今天的主题,空间计算。众所周知,信息处理领域涵盖复杂,包括对外部环境的感知、理解、交互、协同,以及基于平台的数字内容创作。对空间计算而言,空间交互是关键组成部分,具备高标准的技术要求。首先要具备实时性,要能够快速捕捉、追踪和渲染;同时要具备高精度,通过强锚定感达到极高的虚实融合效果,否则容易失真。其次,高可扩展性,要能够支持不同的硬件设备和应用场景。同时,要具备丰富的交互方式,比如手势、语音、眼动等等,以便自然的交互操作。还需要有个性化,针对外观、功能、特性的差异实现丰富的个性化需求。最后,还要具备数据和隐私安全。空间交互具备这些特性,可以把物理世界和数字世界融合起来,让信息可以充分展示,人可以和信息自然互动。

回顾历史,全球第一台物理计算机,可能是古代的算盘,通过物理的输入和输出就可进行简单的数学运算。在此基础上,后续实现技术突破后,计算迁移至屏幕之上,数字技术和交互技术得到了长足的发展。但无论如何,这些技术发展都会被限制在小小的方寸之地,而空间计算就是打破该限制的主要途径。

根据场景的不同,我们陆续推出了系列产品,一是Glass 2、头环形态的X-Craft等针对专用场景的AR工具,二是以Station+Max的To C组合为代表的AR设备。我们持续思考的问题是,怎样进入一个真正具有个人计算平台性质的AR时代?要从几方面入手,首要因素是空间信息的定义,它的形式可以是视觉、听觉上的。其次是空间信息显示,空间非常广阔,对于如此广阔的空间,信息不能过于爆炸,如何优雅地在其中显示?在信息布局和呈现方式上需要精心设计。此外,人和空间信息的自然交互形式,是通过手势,通过语音,还是通过其他的方式,在不同的应用场景下需要做合适的选择。最后是形态表现,它应该长什么样?目前形态存在多样性,但本质上而言,眼镜必须兼具轻便与舒适。要追求以上的空间计算能力,适合采用分体形态,感知和显示由头显处理,算力、电池等部分由边缘计算承载,通过分体形态可达到出色效果。

在此背景下,今年8月份,Rokid推出了AR Studio空间计算套装以及相应的YodaOS-Master操作系统,并基于单摄构建了空间闭环。为什么用单颗摄像头,而非多颗摄像头?主要是考虑重量、功耗、结构稳定、单通道算力要求相对低等优势。基于前述的空间交互,我们打造了整套6DoF的SLAM技术以及自然交互的3D手势,通过将其融入系统,使整个系统拥有统一的交互界面和体验。当然,Rokid也正通过算法优化、硬件加速,实现更为优质的体验。

Rokid着力打造开放生态,也发布了Rokid UXR2.0 SDK。8月份发布后,现在已经有很多开发者基于该SDK,利用Rokid空间交互能力展开相关空间计算场景的开发。

目前,我们主要提供四个主要能力:(1)多模态交互,提供3Dof、6Dof等多空间定位技术,还有手势、语音、头控、射线控制器等。(2)原子算法能力,将算法融入系统,推动整个应用自然流转。(3)多种开发工具协同。提供性能监测模式,让开发者可以专注于的内容开发,监测应用自身的性能表现。(4)多生态支持。Rokid很早就开始支持OpenXR标准接口和主流引擎,比如Unity开发者可以轻松开发和移植他们的AR应用。同时,在Master系统里,我们内置了JS AR引擎和小组件容器,Web开发者可以轻松上传自己的组件,在系统中让大家使用。

整体系统架构共分为三层,底层是基础系统,算法、系统能力、软件能力集中在中间能力层,上面是提供给开发者的SDK,以及面向行业、面向普通用户的应用。

Rokid创造了一种信息流的展现方式,如何利用这种展现方式?大家以前是手机上直接浏览、上下刷、瀑布流的方式,而空间出现后,信息的另外一种布局方式出现,通过空间化的方式,所见即所得,所见即所点,让大家更自然地流转信息。在手势操作方面,Rokid持续打磨底层算法技术,可实现偏低位置的点击、触摸等远场手势,同时也可和虚拟物品进行近场交互,手势在空间计算中是非常重要的一种交互手段。

Rokid提供了空间计算的创作和体验的编辑器解决方案,分为创作端和体验端,即灵境 ARMaz 3。该套工具的应用领域涵盖博物馆、展厅,适合在大空间尺度下进行空间定位和交互。在创作端可进行拖拉拽操作,具有非常好的体验。

回到生态这个话题,不限于此前展示的核心场景,生态也提供了更为多样的内容,包括Unity生态和安卓生态。Rokid致力于打造各种活动,吸引开发者提供更多的优质内容。我们认为,AR是一个注重体验的产品,最好的方式是让用户关注内容而非设备本身。

在产品方向,Rokid同步深耕To B和To C。在To B方向,覆盖了企事业、文旅展陈、教育、医疗等等,开发者也持续提供了非常多创新性场景。

数字文化方向,目前覆盖了全国两百多家主流的博物馆和景区,取代了以往传统人工导游或讲解器的方式,AR眼镜可以展现更丰富的数字内容,并且通过空间技术实现内容互动。

在企事业端与工业应用方面,Rokid覆盖了电力、石化、轨交、医疗等数十个领域,聚焦于一线员工效率和体验的升级。在过去,绝大多数制造业是用Pad进行相应的自动化或信息化的处理,而眼镜可以解放双手,信息通过摄像头直接传递到后台的专家,专家进行后台的实时标注,让信息迅速展现在一线员工面前,进行最直接、最自然的信息交流,有效提升效率和体验。

最后,这是我们官网,这里是对外的合作渠道,在这里也真诚地邀请各位嘉宾和朋友来Rokid进行交流和体验,因为空间计算最重要的是体验。

今天我的分享到此结束,谢谢大家。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-12-11
FBEC2023 | Rokid副总裁 & XR中心负责人 王俊杰:Rokid,开启空间计算全球化时代
FBEC2023未来商业生态链接大会暨第八届金陀螺奖于2023年12月8日在深圳福田大中华喜来登酒店6楼盛大召开

长按扫码 阅读全文