近日,一年一度的全球计算机视觉顶级会议CVPR落下帷幕。OPPO在本次会议上屡获佳绩,在六大赛道共十二项赛项中取得一项第一,七项第二,四项第三,排名仅次于百度等国内第一梯队的参赛选手,再次展示了OPPO强劲的AI创新实力。
本次参加CVPR2021竞赛的团队是来自OPPO研究院智能感知与交互研究部和OPPO美国研究所,他们先后在多目标行为分析、足球行为分析、长视频理解、时空行为检测、跨模态分析及人机交互识别六大赛道上取得优异的成绩。他们通过对算法的优化、训练,不断强化OPPO的AI能力,让AI更好地为人类服务,让AI更懂人。
而由OPPO智能感知首席科学家郭彦东与清华学者等共同发表的论文《View-GuidedPointCloudCompletion》,也被本次CVPR收录。该论文通过执行有效的跨模态和跨级别融合框架,为点云补全任务提出了一套视图引导的全新解决方案。
其中,OPPO在多目标行为分析(Multi-AgentBehavior)赛道中收获颇丰,其所应用的AI算法能基于特征点信息准确判别、预测动物及人在复杂交互内容下的行为。OPPO凭借着领先的AI算法能力,从全球240多个顶尖参赛团队中脱颖而出,获得子赛项少样本行为分类任务(LearningNewBehavior)第一,及传统分类(ClassicalClassification)与标注风格迁移任务(AnnotationStyleTransfer)赛项的第二与第三名。目前,这项技术正在OPPO智慧工厂发挥作用,生产线上的工人们在这套算法的辅助下,可以避免关键生产环节的错漏错放,让自身和产线更安全。
多目标行为分析赛道
从计算智能到人本智能,OPPO让AI更“懂”人
在基于多张2D图片的3D人脸重建(3DFaceReconstructionFromMultiple2DImages)挑战赛中,OPPO自研的AI算法所还原的三维人脸模型与真实人脸误差仅为1mm左右,在主要指标成绩排名中取得第二名。该算法克服了在实际生活中,特别是动态视频拍摄时,因为动作导致的人脸五官点不明晰、表情夸张、甚至图片数据失真等问题。
事实上,OPPO自研的人脸检测算法已能够识别635个人脸特征关键点,并实现30次/秒的高速运行。在不久前发布的OPPOReno6系列上,依托于该算法架构的AI焕采美妆视频技术为用户轻松打造了动态的自然美妆效果。这项技术将推动人像视频技术“升维”进化,以3D级的特征点识别、令“上妆”效果更服帖;也将在社交平台上制作出更丰富更贴合的AR特效,实现“上镜自由”让用户在日常生活中享受到技术带来的美好瞬间。
基于多张2D图片的3D人脸重建赛项
让AI理解我们所处的时间和空间
OPPO的AI能力目前已发展到可以识别人在时空环境中的行为状态了。在足球行为分析(SoccerNet)赛道中,OPPO取得动作定位(ActionSpotting)和回放定位(ReplayGrounding)两个赛项第二名,仅次于百度。这项挑战需要在一段足球比赛视频中辨别出十几种关键动作,包括越位、红牌等行为。这些动作基础规则复杂,动作幅度小,连人类都很难识别出来。同时AI算法还需要排除摄影机位等干扰因素,准确定位回放片段在原始比赛视频中发生的时间点。在不久的将来,这项技术将为体育爱好者们带来福利,在比赛后AI可以实时整理精彩集锦。在该技术的帮助下,手机相册也可以自动制作类似“精彩一周”的视频集锦,让用户可以随时回顾自己生活中的美好瞬间。
足球行为分析赛道
在跨模态行为分析(MMact)赛道上,OPPO分别在行为识别(Cross-ModalActionRecognition)与行为定位(Cross-ModelActionTemporalLocalization)两个子赛项中取得第二名的成绩。OPPO强大的AI算法仅通过视觉信息便可准确识别一段视频中人物在特定空间内发生的交谈、屈膝、走动等十余种动作。这种行为识别和行为定位在未来有望成为家中的贴心保镖。当父母不在身边时,AI可以在宝宝下意识做出危险性动作的时候,及时提醒父母,避免宝宝受到伤害。
此外,OPPO还在时空行为定位(AVA-Kinetics)赛道获得第三名。AVA数据集作为行业内第一个开辟时空行为检测的数据集,使用该数据集的定位赛项历来是人工智能的热门赛道之一,每年不乏国际顶尖科技公司与院校的知名团队参与其中。时空行为定位算法不仅可以准确识别视频中人们的行为,还可以同步定位其所处的时间段和空间范围。这也意味着,OPPO的AI技术不仅能理解你在做什么,还可以在时空中“找到”你。
OPPO正在向更高维度的AI技术探索
本次CVPR上,OPPO在学术界前沿领域长视频理解(LOVEU,Long-formVideoUnderstanding)挑战中,获得两大赛项第三名。这赛道对算法的泛化性提出了极大挑战,它需要AI在预先没有特定分类标准的情况下,自行理解视频的意义并分割出其边界的时间段落。AI需要像人一样思考,理解视频中人类动作、颜色、物品、乃至光源的变化,并对变化点进行判断。未来,这项技术可以广泛应用在视频领域,作为AI处理视频的基础工序,为后续包括人脸识别、行为识别等AI任务的选择和执行奠定基础。
OPPO研究院美国研究所参与了稠密深度估计挑战赛道,展示了能够基于2D图像输出稠密3D深度信息的技术,获得自监督学习赛项第二名的成绩,并获得“最佳创意奖”。该技术通过利用深度学习模型直接从普通图像输出深度信息,未来有可能替代ToF这样的深度传感器,带来体验更好的室内外导航。
OPPO始终秉持着“科技为人以善天下”的企业使命,在构建自身AI能力时也一直围绕着“以人为本”不断努力,向着更智能、更前沿的方向努力,让AI能够真正地为人所用,为我们带来更智能更便捷的生活。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 全球个人智能音频设备Q3出货量激增15%,苹果下滑9.2%
- 中国智能手机品牌加速进军欧洲高端市场
- 华为Mate 70系列即将发布,霸占微博热搜前三
- 明基发布新款27寸2K显示器PD2706QN,首发价3499元
- PC Partner迁总部至新加坡并上市,生产基地转至印尼,继续领跑全球GPU市场
- 深耕智能家居领域,苹果计划2025年推出AI驱动的智能家居控制中心
- 美媒:面对现实,苹果可能再无iPhone这样的爆款了
- 老黄还是不死心:英伟达明年再次杀入PC市场
- 匠心臻品 掌控随心 心系天下三星W25 | W25 Flip闪耀登场
- IDC:2024年第三季度全球传统PC出货量6880万台,同比下降2.4%
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。