海量数据下,八戒知识产权是如何解决“以图搜图”难题的?

移动互联网世界,我们的信息获取方式很大程度上依赖于搜索。

然而,即使是技术最为完善的文字搜索,往往也有其乏力的地方。比如,对于商标图片,如果你不知道编码,苍白的文字描述是很难帮你正确检索到你需要知道的商标图形的。而此时,你就需要“以图搜图”的功能来实现。

正是发现这一市场痛点,八戒知识产权在2016年开始了商标图形检索系统的研发,并于2017年1月成功上线。

海量数据下,八戒知识产权是如何解决“以图搜图”难题的?

  商标检索结果页面

告别繁复的检索

近年来,随着双创浪潮的推动,以及品牌意识的逐步增强,企业对商标的重视程度可谓逐年提高。有数据显示,2016年国内商标申请注册量为350万件,年增速超过20%。随着创业公司激增和品牌意识增强,商标申请量将继续攀升,仅2018年全国商标注册申请量就超过700万件。

由于商标在注册过程中需要进行唯一性审查,所以检索重复商标就成了商标注册代理机构的首要工作。就商业领域而言,商标包括文字、图形、字母、数字、三维标志和颜色组合。以往,大部分代理都采用白兔系统。但该系统仅能检索文字商标,对于复杂的图形商标,工作人员只能通过人工审查的方式进行,而用图形内容检索的方式则无疑更加高效。

尽管包括Google、百度等搜索引擎均提供以图搜图功能,但因图像相似度判别复杂度的影响,图像检索需要区分场景才能获得最佳效果。由于商标图形数据非常独特,所以直接利用搜索引擎已有的图形检索,其结果往往无法满足使用者需求。

八戒知识产权商标图形检索系统负责人王豪杰介绍,图形商标搜索包含三步:识别、理解和检索。在提取特征点进行基础识别之后,搜索系统需要通过深度学习算法对图片进行理解,找到相对精确的备选图形,随后通过检索按照相似度排序为用户提供最符合条件的图形商标。

“一般而言,图片搜索的运算量至少是文字搜索运算量的千倍以上,加上图形搜索比较重视搜索场景,因此对硬件系统和软件系统要求很高。而图形商标由于抽象化、非标准化等特性,也使得这项技术比人脸搜索等图形搜索难度要更大,研发周期也更长。”王豪杰说。

但这不符合创业者分秒必争态度,所以,八戒知识产权希望利用图像比较技术和搜索引擎技术,研发出了一套符合商标审查、准确、高效的商标图形检索系统。

海量数据下,八戒知识产权是如何解决“以图搜图”难题的?

  商标图形检索系统界面

跨入只需3秒的以图搜图时代

传统商标审查需人工判别:630多万个图形商标按照1806种图形要素分类,将每个要素下的商标与需判别的商标进行比对,以此判断商标申请是否通过。

由于商标局审查员对于近似商标的判定具有较大的自由裁量权,八戒知识产权在深入了解审查原则和审查员习惯的基础上,利用专业的图像比较技术和搜索引擎技术,对商标图像进行了视觉分析及特征提取,并对数据库的数百万张图像特征创建了数据索引。在查询时,自动对检索结果进行优化排序,并在输出结果后提供了多种可自定义的筛选与条件过滤等功能。

经过一年的时间,团队五个技术成员,迭代了十几版,目前八戒知识产权已将搜索系统运算速度从3分钟压缩到3秒以内,系统也由原来按照图形商标1806种要素搜索改变为全库搜索,搜索结果的错误率在5%以内。

同时,通过优化核心算法,使硬件成本降低了30%,现在用7台服务器可以实现原来运行十台服务器的效果,降低了项目的运维成本。

如今,八戒知识产权的商标图形检索系统,有着领先的图片检索技术,以图搜图只需要将目标图片上传,一键检索即可找到相似商标图形详细信息,还可以对结果进行筛选,使得你找到更加精确的结果,不但节约的商标检索的时间也大大提高了商标申请的通过率。

现在图形商标搜索市场各路玩家陆续加入,从传统的机构如国方、集佳、社文到新兴的互联网机构,比如智慧芽,还有产业投资密集并购。大家齐头并进,暂未出现一家独大的局面。

对于来自领域内蜂拥而至的竞争,王豪杰认为这并非坏事。“任何市场都有竞争,竞争一方面可以压迫自身的不断发展,另一方面也可以促进市场的繁荣。而最重要的,其实不是市场有多大,而是自己能吃下的蛋糕有多大。”

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-03-15
海量数据下,八戒知识产权是如何解决“以图搜图”难题的?
移动互联网世界,我们的信息获取方式很大程度上依赖于搜索。然而,即使是技术最为完善的文字搜索,往往也有其乏力的地方。

长按扫码 阅读全文