华捷艾米沈瑄:视觉+语音,人机交互的未来

近年来,在人工智能的浪潮下,AR与VR发展迅速,并逐渐形成了完整的产业链。值此背景之下,华捷艾米软件科技有限公司凭借3D视觉感知、自然语言交互以及AR体感等技术,打破了微软以及苹果在AR领域的垄断产业,一跃成为全球第三家AR摄像头研发企业。为此,OFweek人工智能网编辑特别采访了华捷艾米软件科技有限公司COO沈瑄,以华捷艾米所面临的难点为引,共同探讨AR体感人机交互未来的发展趋势。以下为采访文字实录:

华捷艾米软件科技有限公司在高交会的展台

短短数年,华捷艾米便在AR体感人机交互和人工智能领域取得了快速发展,受到业界认可。那么,华捷艾米在这方面做了哪些努力?您认为主要的难点问题是什么?

沈瑄:现阶段人工智能产业的主要的难点有三个,一是资金,在深度学习的骨架模型方面,我们前期共投入1.5亿元人民币,包括数据采集、数据标记和模型训练、以及芯片的设计流片等等;二是时间,在2000年至2010年之间,我们借助清华大学的大型计算机对模型进行训练后,便将样本导入其中,然后再次训练两个半月,形成了基本的算法,这是第一部分。第二部分,我们需要将算法固化成芯片,芯片生产有一次流片和二次流片,其流片的良率较低,每一次流片跨度需要3至6个月左右,且每一次流片都需要几千万的投入;第三是供应链的整合,由于是新兴的技术,那就需要我们自己来整合上下游的供应链。

华捷艾米软件科技有限公司COO沈瑄

目前,华捷艾米公司主要产品有哪些?其市场表现如何?在技术方面有哪些积累和突破?

沈瑄:我们公司的产品主要有三类,第一个是相关项目;第二是整机产品,我们将OTT盒子和摄像头做成了一体,主要应用于教育或者学习领域;其三,小型化手机模组,AR摄像头应用于手机领域的市场是应用于TV市场的十倍。由于手机集成化很高,如果想添加体感技术这一功能,则相对较难。相比之下,AR体感技术嵌入TV则比较简单,嵌入良率高达98%,所以短期之内,我们先推出嵌入TV的产品,将其做好之后,逐步向手机领域拓展。

华捷艾米公司目前和国内一些厂商合作情况如何?对于未来发展有何具体规划?

沈瑄:目前,我们正在和华为以及小米等国内手机厂商沟通。与此同时,我们体感技术的参数,如分辨率、帧率以及使用的距离等都和目前最先进的技术接近,而未来我们将会重点提升产品的产能与良率。对于未来我们有短期规划和详细规划两部分,短期规划为:加大在3D-AR与AI技术方面的研发资金投入,拓展其在手机、智能安防、机器人、医疗康复等领域的应用,并在各领域成立相关的技术方案公司。详细规划如下:2018年成立AI研究院,专注视觉、听觉、交互等人工智能感知技术的基础研究;推出全球首款全能感知通用芯片;2019年嵌入式模组研发商业化完成,智能感知算法的全部硬件化IC,嵌入式平板/手机方案国际领先,推出针对各行业的智能感知解决方案;2020年成为国内第一人工智能感知方案供应商。

华捷艾米软件科技有限公司AR摄像头

面临技术难点,华捷艾米是如何突破的?未来的挑战与应对措施如何?

沈瑄:在一些技术难点方面,我们也是通过与清华、中科院、武汉大学以及华东理工等高校合作方式共同解决。至于未来的挑战主要有两个方面,其一,在目前AI的风口下,规模过小以及高端人才不足乃是我们公司的短板。当然,我们现在也通过融资方式去筹集更多的资金,以扩大企业规模,同时,我们也会去招募更高级的优秀人才;其二,公司在游戏进入手机行业方面的良率较低,所以我们在融资的时候会稍微注重考虑上游一些,通过产业链上的产业基金提供的资源,使我们的产能能够大幅度提升。

目前,人工智能已经成为全球关注的焦点方向,您认为人工智能带来的颠覆效应主要表现在哪些方面?目前国内现状如何?未来在哪些领域更具前景?

沈瑄:从目前的发展情况来看,人工智能带来的颠覆性主要体现在面部识别这一方面。在人工智能交互方面,以科大讯飞合作为例,我们通过手势、人脸识别或者语音形成一种新的人机交互方式。事实上,现在的人机交互已经跨越了多次数字浪潮,而数字浪潮至今则经历了四个阶段,第一阶段则是DOS操作界面,纯文本的形式;第二阶段,基于Windows的出现,其鼠标、键盘以及浏览器窗口形成了一种交互方式;第三阶段,以手机、移动端、触摸屏为导向,包括近年来的语音+触摸屏交互方式等;第四阶段,则以VR模式为主,通过人脸识别或者语音的形式形成新的交互方式。而未来人机之间则将通过视觉+语音交互方式,如同人与人之间交流般,回归最朴质自然沟通方式。

未来应用领域则比较广泛,毕竟在应用领域方面它需要一点点渗透,而在目前,由于机器视觉是比较基础的基础,它可以应用的场景很多,比如电视、游戏健身、教育培训、机器人、医疗康复、智能安防以及IOT物联网等领域。

作为机器视觉技术的领军者,华捷艾米在未来的发展方向是什么?是否有进军海外市场的打算?

沈瑄:目前,我们的主要发展TV或者OTT盒子业务,明年我们会发力嵌入式设备。应用场景也会逐渐向游戏、健身以及幼儿教育方面发展,以此提升用户体验感与接受度。

在海外市场,目前我们主推幼儿教育。另外,在国内我们将会有更大的市场空间,因为更加了解整个产业链。如目前很多电视剧生产商都在中国,这也为我们提供了一个很好的运营渠道,而这些运营渠道在海外则无法实现。随着国家相关政策的不断实施,我们也会借此机会逐步向国外市场发展。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2017-11-22
华捷艾米沈瑄:视觉+语音,人机交互的未来
近年来,在人工智能的浪潮下,AR与VR发展迅速,并逐渐形成了完整的产业链。

长按扫码 阅读全文