第四届全国人工智能大赛 三大赛题专家答疑

人工智能作为引领新一轮科技革命的和社会发展的战略性技术,正在快速与各行各业共融,逐渐改变着人们的生活和工作方式。激发创新意识,选拔尖端力量,吸引优秀人才,全国人工智能大赛已经成为推动行业升级的一个重要窗口。第四届全国人工智能大赛5月正式开赛,目前已吸引七千多支队伍报名参赛。

为了帮助参赛团队更精准地理解赛题、更合理地运用AI相关技术,第四届全国人工智能大赛组委会邀请鹏城实验室副研究员杨文瀚老师、王伟老师与助理研究员马小雨老师分别针对“AI+视觉特征编码”、“AI+无线通信”、“AI+视频质量评价”三个赛道,进行赛题专业背景知识和参赛攻略分享以及互动答疑。

AI+视觉特征编码,聚焦智慧城市

为加快特征编码关键技术演进,面向视觉大数据应用,针对码率约束下的机器视觉任务,考察选手视觉信息压缩技术与智能处理分析技术的融合,本次大赛设置“AI+视觉特征编码”这一赛题。鹏城实验室副研究员杨文瀚老师围绕该赛题进行了赛题解析与技术分享。

今年对赛题进行了升级,更考虑实际视觉分析应用,数据对象从图像视频压缩拓展到视频压缩,任务设置对标国家需求,聚焦智慧城市主要为交通事件监测,力求通过比赛解决智慧交通难点问题。本年度赛题特点明显,一是更加面对真实场景应用,二是特征数据压缩与重建技术难度升级,三是验证技术泛化能力,保障竞赛公平性。

赛题从初赛、复赛到决赛,每个赛程任务不同。初赛操作对象为特征向量,考察粗粒度交通分类,任务为独立测评。复赛决赛操作对象均为特征张量,依旧考察粗粒度交通分类,复赛任务为独立测评,决赛任务为联合测评。值得注意的是三个赛程均会进行泛化测试,初赛复赛泛化测试不计分,决赛泛化测试将计入总分。

AI+视觉特征编码答疑部分汇总

问题一:与初赛相比,复赛与决赛的训练数据是小批量还是大批量?

答:复赛的训练数据规模与初赛相当。

问题二:压缩是可以全视频的特征整体压缩与重建,还是必须按每一帧的特征分别压缩与重建呢?

答:可以按全视频特征进行整体压缩与重建。

问题三:每段视频抽250帧是按照顺序的吗?

答:按照时域顺序排布。

问题四:2048维向量是原始视频数据还是经过模型识别的高层特征呢?

答:高层特征。

问题五:高维特征张量指的是什么?

答:超过二维的特征表示。

问题六:是否提供原视频帧,还是仅提供高维特征张量?

答:无法提供原视频帧,原视频帧涉及隐私及安全性问题,数据无法公开。

问题七:250帧有时序关系吗?

答:按时序顺序排布。

问题八:复赛是压缩特征张量吗?

答:是的。

问题九:有限制不能用预训练吗?

答:没有限制。

问题十:在复赛与决赛中,压缩与重建视频、特征向量还是特征张量?

答:特征张量。

AI+无线通信,引领通信未来

鹏城实验室副研究员王伟老师对“AI+无线通信”赛题进行了详细讲解。本届赛题的设置既考察人工智能方法,又考察人类专家知识,鼓励参赛选手采取数据驱动的思路和采用深度学习的方法来设计适用于无反馈通信系统的下行传输方案,攻克如何最优地利用辅助信息助力通信这一技术难点。

开放、云化、智能化已经成为无线通信网络的发展趋势,AI+无线通信技术将驱动新型移动信息网络向前发展,成为融合通信、计算、感知、AI、安全等多种能力为一体的智能通信系统。直播过程中王老师分享了他对研究AI+无线通信意义的看法,他认为其即可以降低移动通信系统的空口资源开销,又能助力下一代无线接入网的全解耦,意义重大。

AI+无线通信赛道答疑部分汇总

问题一:数据集一个位置对应40个csi是什么意思?

答:对csi的采样获取的是时间片段里的一个序列,从中挑取了40个进行呈现。

问题二:复赛与决赛赛题会有变化吗?

答:会有些变化,但大主题不会变。

问题三:所有数据的地理位置都是按照时间顺序采的吗?

答:并不是。

问题四:测试集与提供的训练集在地理位置上的关系有多大?

答:测试集有和训练集相同位置的csi,也有不同位置的csi。

问题五:这个赛题主要考察编码方案的设计还是神经网络的搭建与优化?

答:主要考察选手如何结合专家知识及神经网络的技巧来设计出性能更好的方案。

问题六:模型有大小有限制吗?

答:模型大小限制在100兆。

问题七:报错信息与什么相关?答:可能与环境有关

问题八:训练集和测试集的天线朝向是固定的吗?

答:对,是固定的

问题九:给出的地理位置是绝对坐标还是相对坐标?

答:相对坐标

问题十:笛卡尔坐标单位是什么

答:米。

AI+视频质量评价,提升视觉享受

鹏城实验室助理研究员马小雨老师针对“AI+视频质量评价”赛题进行介绍,该赛题基于鹏城实验室近期构建的大规模超高清视频压缩损伤数据库,参赛选手需要利用训练集/预训练集中的失真视频及其所标注的主观/客观质量分值作为数据基础,设计相应的深度学习评价模型以准确地预测测试集中各失真视频的主观质量分值。

值得注意的是复赛与决赛计划在中国算力网智算中心节点及鹏城云脑Ⅱ NPU环境中进行,马老师对数据集及赛程评分方法进行了详细介绍,训练集包含视频序列与主观值均会公布给选手用于训练模型,测试集及验证集会将视频序列公布给选手,主观值将储存于后台。初赛一致性评分方法为线性相关系数PLCC+等级相关系数SRCC的总合,复赛与决赛一致性评分方法相对更为复杂需要考察PLCC、SRCC、选手运行效率、分段可用率及可用率五部分内容。

AI+视频质量评价赛道答疑部分汇总

1、如何在NPU环境中获取比赛数据?

答:本次比赛主要使用鹏城云脑Ⅱ的调试任务和训练任务,其中调试任务用于选手测试代码是否有BUG,训练任务用于实际训练和测试选手所设计模型的过程,为方便选手调试,公开了采样后的“玩具”数据集,选手可自行下载。

数据集中文件格式是什么样子的?

答:由于本次比赛希望选后根据视频像素域的特点分析其感知质量,需要屏蔽压缩过程中的配置信息,因此将源文件解压为YUV422P10LE格式,为方便选手下载将YUV数据封装为AVI文件。

可以使用任意网格提取特征,模型大小是否限制?

答:并不对所使用的预训练模型进行限制,但在复赛及决赛过程中,会将模型的运行效率进行考核标准,和预测一致性一起计入选手总分。

是否可以自己用自己的数据训练预训练模型?

答:初赛过程中并不禁止,但复赛和决赛要求在中国算力网智算中心节点和鹏城云脑Ⅱ上进行,且选手需要再检查过程中配合进行复现,并说明代码中所使用的各模块作用。

训练时间和推理时间是否有限制?

答:没有明确限制,但初赛、复赛及决赛结束前一天内才会公布用户评判最终成绩的验证集,选手需要在后续时间内提交验证集结果。

复赛和决赛只能使用910 NPU吗?

答:是的

运行效率如何算分?

答:以实时为满分,实时为处理一个视频的时间小于10秒钟,达到这个标准则为满分。如果有选手比实时快则以这位选手的标准为满分,其他分数根据对比以此递减。

预训练模型从平台找吗?

答:大家可以从MindSpore官网中寻找下载。

各部分分数权重相同吗?

答:不同,总体来说运行效率的权重会偏低点。

欲了解更多赛事资讯与精彩内容,可搜索公众号「全国人工智能大赛」进行关注。初赛期间大赛目前仍在面向全球开放,个人、高等院校、科研单位、企业或创客团队等均可报名参赛,详情请登陆,大赛官网https://naic.pcl.ac.cn/

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )