超盟数据李健豪——硅谷极客如何挖掘国内零售大数据“金矿”

超盟数据CTO李健豪

在校创业被收购,进入亚马逊和IBM研究数据挖掘

从澳门高中毕业后,李健豪来到美国UIUC(伊利诺伊大学厄巴纳-香槟分校)攻读CS专业。大学期间,一位在保险公司实习的朋友向他抱怨,手动填写保单费时费力还难以保证准确性。2010年还未毕业的李健豪创办Synchronize,通过实现保单签名电子化来改进传统的保险行业。在拿下美国三家最大保险公司后,公司进入快速发展期,并成功被收购。

随后,抱有更远大志向的李健豪进入亚马逊,在支付部门处理数据流。一年多的时间里,李健豪对数据挖掘产生了浓厚的兴趣,便决定重返校园,师从全球大数据专家被誉为“数据挖掘第一人”的韩家炜教授专门研究数据挖掘,而具体的研究方向,便是通过数据挖掘来研究用户的购买行为。

当时,李健豪所在的实验室和IBM合作拿到了颗粒度很细的数据,也通过研究顺利拿到和购买行为相关的专利。但对于李健豪来说,他想要做的不仅是学术科研,更想把研究应用起来。

一直以来,李健豪对零售都有很浓厚的兴趣:为什么一款产品换了新的包装就会有新的购买群体?人们选择购买或者不购买背后的逻辑是什么?

2015年,李健豪创立StylePuzzle,通过数据挖掘解决新产品的市场定价问题,并成功拿到真格基金百万美元投资。

有意思的是,李健豪发现StylePuzzle的大部分客户来自北京,为了一探究竟,2015年李健豪第一次来到北京,到了年底便搭建了StylePuzzle的技术团队。

邂逅另一位创业者,零售与数据碰撞出火花

经过真格基金徐小平介绍,李健豪认识了超盟数据CEO李思贤,当时的李思贤想要做的就是通过采集零售商业数据后为商家提供数据营销解决方案,于是两个跳跃的因子碰撞在一起。

当时,国内的新零售热潮还未兴起,而在国外,尤其是美国和日本,对于商品的信息化使用程度已经成熟,“国内对于商品的信息化一定是有需求的,只是迟早的问题,所以我们决定先进入这个市场。”

2016年4月,李健豪正式加入超盟数据担任CTO,专注于提供线下通路零售渠道的大数据分析及人工智能产品。

在硅谷时,李健豪就曾赢过6次全美黑客马拉松冠军,在24小时内把一个想法实现出来,证明自己算法的可行性。这种“小团体作战”的经验李健豪快速组建起超盟数据的技术团队。

“当时李思贤给我看了一张便利店的小票,上面的数据更加真实且颗粒度更细,研究起来也挺有意思。”一开始,李健豪负责数据的清洗、处理非结构化数据。

由于每个便利店的小票格式都不一样,超盟数据会先把数据格式标准化,然后进行清洗, 之后再进行Named-entity recognition(NER),最后通过匹配超盟內部的商品数据库, 对每个商品进行维度扩充并打上标签。比如说一个商品名称进入系统,我們会把商品品牌、外包装颜色、规格、成分等50多个维度附加到这个商品上,因此合作一家新的便利店时,便能对产品进行快速的匹配,当需要用到数据时就可以快速提取出来。

“传统的数据公司可能需要花6个小时来处理,我们能够把时间缩短到2-3分钟。”李健豪说。

在超盟数据有更多数据可以被挖掘

超盟数据有数据化运营、品类管理、消费者洞察三类产品,可以服务连锁便利店、社区超市等多个线下零售业态。

在数据化运营方面,主要是基于全量交易的大数据分析,精准定位促销受众、同时通过算法全自动实现异常数据的实时反馈,提高销售机会和关联消费。因为对于当下的便利店主来说,他们所能掌握的便是“一瓶红茶以多少钱卖出,一天卖出多少瓶”这样的基础信息,不容易发现背后的销售逻辑。要想看到更加具体的信息,便利店只能通过自己的ERP系统调取数据,通过人工处理制作成表格,从数据生成到拿到报告一般会耗时多个工作日。超盟数据通过技术分析帮助便利店实时生成数据报告,让店主能够同时看到销售业绩、门店、库存等不同维度的信息。

品类管理则是帮助企业提高库存周转率,有效提升前台毛利。一般来说,2/7/1 或者 3/6/1比例来进行行商品划分,再对其从销售量和毛利两个维度来细分,又可以分成AB、BA、AC等多种不同的组合。比如一件商品的评级为AA则意味着它销量高、毛利高,评级为CA则意味着销量低毛利高。超盟数据会在商品的评级中引进新的维度来进行评估,例如商品连带购物篮系统,连带毛利等,重新计算商品评级,防止一些不该被淘汰的商品被淘汰掉。

当连锁便利店数量越来越大时,靠以往的数据手段很难得到如此精准的分析,但是超盟数据可以通过分析店面周围的商业及交通环境情况、周边顾客人均工资、房租水平、GDP水平等做出精准的画像,推荐合适的商品上架。李健豪认为多维度的门店相似度模型同时也是机器不断调优相关参数的权重的结果。精细化多维度的门店相似度算法可以更好地将门店进行分类,更甚于传统的商圈划分方法,更精准洞察消费者画像。多维度的门店相似度模型同时也是机器不断调优相关参数的权重的结果。

零售+人工智能在中国将更有想象空间

“目前很多传统连锁便利店尚未全面信息化,所以超盟数据的任务就是为它们配备上信息化的武器。”在李健豪看来,零售+人工智能在中国将更有想象空间。

超盟数据的科技壁垒主要体现在三个方面:一是提高数据清洗的效率,将用时从6小时缩短到2-3分钟,目前超盟数据每天处理的数据在百万亿级别;第二是在大量的数据基础上,算法可以越来越精准;第三则是在团队的组合上,CEO李思贤出身于华东区TOP3蜂蜜零售家族企业,对于快消品零售有深厚积累,李健豪长于数据挖掘,快消零售和数据科学高度融合。

目前,超盟数据已经覆盖超过1万家门店,包括北京、广东、河北、内蒙古、陕西等连锁便利店品牌,市场占有率在18%左右。

今年11月,超盟数据已完成由襄禾资本和远镜创投投资的数百万美金A轮融资,此前还曾获得真格基金和力合清源数百万人民币的天使轮投资和山行资本千万级人民币的Pre-A轮投资。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2017-12-19
超盟数据李健豪——硅谷极客如何挖掘国内零售大数据“金矿”
超盟数据CTO李健豪在校创业被收购,进入亚马逊和IBM研究数据挖掘从澳门高中毕业后,李健豪来到美国UIUC(伊利诺伊大学厄巴纳-香槟分校)攻读CS专业。大学期间,一位在保险公司实习的朋友向他抱怨,手动填写保单费时费力还难以保证准确性。2010年还未毕业的李健豪创办Synchronize,通

长按扫码 阅读全文