作为亚太地区知名的智能语音与人工智能上市公司,科大讯飞基于“技术顶天,产品落地”的战略理念,不断进行着核心技术的创新。近年来,科大讯飞除了在智能语音、自然语言处理等领域硕果累累外,在视觉场景理解领域也获得长足进步。
近日,在计算机视觉与模式识别国际会议(CVPR 2019)举办的物体检测挑战赛DIW 2019上,科大讯飞A.I.研究院联合中科大语音及语言信息处理国家工程实验室(NELSLIP)(以下统称为讯飞-中科大联合团队),取得Objects365 Tiny Track第一,Objects365 Full Track第三的佳绩。
DIW 2019挑战赛由旷视科技与北京智源人工智能研究院共同举办,该项赛事吸引了包括腾讯、百度、字节跳动等300多支队伍参赛。而Objects365 小赛道是CVPR 2019主办方为了加快算法迭代速度,研究长尾类别检测问题,而特别设立的。其所采用的Objects365数据集包含63万张图像,高达1000万人工标注框,覆盖365个日常物体类别,堪称最大通用物体检测数据集。
资料显示,旷视 Objects365 数据集是目前全球最大的通用物体检测数据集,不仅具有规模大、质量高、泛化能力强的特点,而且其开放图片数和标注框分别是目前全球最权威的物体检测数据集—— MS COCO 的 5 倍和 11 倍。可见,讯飞-中科大联合团队收入的这两项大奖,都实力彰显了科大讯飞在计算机视觉领域的技术领先地位。
讯飞-中科大联合团队收割的大奖还远不止于此,在文档分析与识别国际会议(ICDAR 2019)举办的多项赛事中,联合团队包揽了手写数学公式识别挑战赛CROHME全部两项任务冠军;在场景文本视觉问答挑战赛ST-VQA挑战赛上,联合团队包揽全部三项任务冠军;在街景招牌中文文本识别挑战赛ReCTS中,联合团队获得单字识别任务冠军。
以ST-VQA挑战赛为例,它是由CVC(Computer Vision Center)举办的一项视觉问答挑战赛,要求算法能够像人类一样解析图像中实体之间的关系,并正确地回答出问题。比赛总共分为三个任务,分别为Task1-Strongly Contextualized、Task2-Weakly Contextualized和Task3-Open Dictionary,难度会逐渐增加。
讯飞-中科大联合团队参加了全部三项比赛,并悉数包揽冠军。此次参赛也是科大讯飞在视觉理解以及多模态数据融合方面的前瞻性探索,比赛中使用的技术为公司未来在多模态交互方面的发展打下了基础。
成立于1999年的科大讯飞,是我国唯一以语音技术为产业化方向的“国家863计划成果产业化基地”、“国家规划布局内重点软件企业”与“国家高技术产业化示范工程”企业,并被原信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。
一直以来,科大讯飞始终致力于推动相关赛道技术落地,目前已在教育、医疗、政法等业务上取得了很好的成效。未来,科大讯飞将继续推进核心技术更始和应用落地,用实实在在的“智慧”成果,践行用人工智能建设美好世界的公司使命。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。