搜狗搜索联合中国中文信息学会,共同发起“CIPS-SOGOU问答比赛”

日前,由搜狗搜索联合中国中文信息学会(CIPS)共同举办的“CIPS-SOGOU问答比赛”正式启动报名。作为国内首档基于大规模真实用户问答数据集的问答评测任务,此次大赛的举办,不仅能为参赛者提供挑战及展示能力的舞台,还将促进学术界及业界在智能问答领域的研究发展,推动智能问答系统更加广泛地面向公众提供信息服务。

此次问答比赛分为事实型问答和非事实型问答两项子任务。按照赛制,参赛者需要根据给定的问题设计算法,从候选篇章中抽取合适的词语、短语或句子,作为问题的标准答案,能够实现正确、完整、简洁地回答问题。每个问题对应给出10个候选答案篇章,每个篇章约50 - 500个汉字。

在评测指标方面,事实型问答子任务将采用Accuracy和Precision-Recall(F1)指标对预测答案进行评价,其中Accuracy计算预测答案和标准答案是否精确匹配,F1计算预测答案相对标准答案的词级重合度,以两者平均值作为最终指标。非事实型问答子任务采用ROUGE和BLEU指标对预测答案进行综合评价。

据悉,此次比赛的事实型问答子任务,将从9月1日起开始提交报名,有兴趣参赛的高校生、业内研究人员等,可通过“搜狗实验室”官网提交报名信息。非事实型问答子任务,则将在12月中旬开始接受提交报名,并陆续公布比赛数据集和Leaderboard。在2018年CIPS的学术年会上,将会对两项子任务中胜出的团队进行颁奖。

值得一提的是,作为联合主办方的搜狗搜索,将向大赛提供来自搜索引擎的大规模真实用户问答数据集。其中,6万个问题(事实型问题3万、非事实型问题3万),代表了最真实广泛的网民信息需求;60万对应问题的候选篇章,来自搜索引擎返回的若干互联网页面;而经过对页面进行人工分析标注,搜狗搜索构建了针对问题的标准答案,最终形成大规模、极具价值的问答数据集。

据了解,目前在智能问答研究领域,可用的大规模公开数据集,尤其是反映真实用户问答需求的中文数据集非常稀缺。业界和学术界受限于技术、数据等因素,当前的研究主要针对“事实型问答”领域,而在与用户搜索场景息息相关的“开放域智能问答”领域则一直无法取得突破性进展。搜狗搜索此次公开的大规模数据集,不仅能促进“CIPS-SOGOU问答比赛”的正常开展,还能将给整个智能问答行业的研究发展提供宝贵的数据支撑,从而推动智能问答系统更加广泛地面向公众提供信息服务。

事实上,凭借在人工智能领域的持续投入及搜索引擎的数据优势,搜狗搜索目前在智能问答领域已处于行业领先地位。搜狗搜索此前已上线的“立知”智能问答系统,就是搜狗研发的面向未来的搜索技术。该系统能够理解用户搜索意图和问题,直接为用户提供想要的答案。目前“立知”智能问答系统不仅能精准回答事实性问题,在分析类问题、观点类问题、数字类问题、隐式问题等方面,都能直接返回精确答案,背后应用了语义分析、问题理解、信息抽取、知识图谱、信息检索、深度学习等众多人工智能技术。

作为智能问答领域的引领者,搜狗搜索在切实推进产品落地、为用户带来优质搜索体验的同时,也注重向行业开放问答能力,不断推动业界及学术界的研究发展。今年4月份,搜狗搜索曾联合CCIR 2017(2017全国信息检索学术会议)成功举办了国内首次大规模真实用户问答数据集上的问答评测任务——首届“面向智能问答的篇章排序”评测比赛,并公开了来自用户真实搜索需求的5万个问题以及从搜狗搜索全网检索结果提供的50万条候选篇章,极大促进了智能问答技术的发展和应用。

相比“面向智能问答的篇章排序”评测比赛,此次“CIPS-SOGOU问答比赛”的赛制、公开数据集等都将进行全新升级,将会在更大程度上促进智能问答领域的学术交流和研究水平。对此次问答评测比赛感兴趣的高校生或业内从业者,均可报名参加。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2017-09-05
搜狗搜索联合中国中文信息学会,共同发起“CIPS-SOGOU问答比赛”
日前,由搜狗搜索联合中国中文信息学会(CIPS)共同举办的“CIPS-SOGOU问答比赛”正式启动报名。作为国内首档基于大规模真实用户问答数据集的问答评测任务,此次大赛的举办,不仅能为参赛者提供挑战及展示能力的舞台,还将促进学术界及业界在智能问答领域的研究发展,推动智能问答系统

长按扫码 阅读全文