作者:刘俊寰
你还记得,半年前,你打开淘宝,是在看衣服?化妆品?还是准备换一个手机壳?
疫情打乱了人们的生活计划,随着年初疫情逐渐升温,各大电商平台的口罩上架后往往秒售罄,有人也因此养成了囤货的习惯。
当疫情向国外扩散,这个变化也在欧美各国开始出现。总部位于伦敦的咨询公司Nozzle专门为亚马逊卖家做算法广告,他们敏锐地注意到了这个变化,疫情之前,手机壳、充电器、乐高在亚马逊销售榜上从来没有跌出过前十,但如今,这些在短短几天内就被挤出榜单,取而代之的是口罩、消毒液等。
他们还绘制了疫情相关产品的变化曲线图:
4月12日至18日,亚马逊网站上的十大搜索词分别是:卫生纸、口罩、口罩、洗手液、纸巾、来苏尔喷雾剂、科乐士湿巾、口罩、来苏尔、防菌口罩和N95口罩。
从这些商品内容也可以追踪新冠病毒的传播轨迹,相关商品的销售量在意大利率先达到峰值,其次是西班牙、法国、加拿大和美国,英国和德国紧随其后。
“短短几天时间就发生了如此不可思议的转变。”Nozzle的CEO Rael Cline说道。这种涟漪效应在整个零售供应链中也现出真身,同时,AI也受到了影响,在库存管理、欺诈检测、营销等算法中已经出现了造成了“打嗝”(hiccups)现象,也就是说,如今,以正常人类行为为基础的机器学习模型已经不能适应社会的变化了。
根据全球AI咨询公司Pactera Edge,“自动化正在走下坡路”,一些工作人员表示,他们正在谨慎地关注着那些硬撑着的自动系统,以便在需要的时候介入人工修正。
从疫情中,也可以看出,我们的生活与AI交织得多么紧密,但也暴露出了一种微妙的依赖关系,我们的行为改变会改变AI的工作方式,而AI的工作方式的改变,反过来会再次影响到我们的行为。
“当身处这样与往常不同的环境时,你永远不能坐而忘之。”Cline说。
世界变了,数据也会变
最开始,机器模型的设计就是为了应对变化,但即使是现在,大多数模型仍然相当脆弱,尤其当输入数据与训练过的数据差距过大,它们的表现就会很糟糕。Pactera Edge副总裁Rajeev Sharma表示,你以为在建立一个AI系统后就能一走了之?这是错误的做法,“AI是一个有生命的、会呼吸的系统”。
根据Sharma与几家公司的交流结果,不少公司因AI无法及时得到修正正在苦苦挣扎。
一家向印度零售商供应酱料和调味品的公司表示,此前公司一直依靠AI的预测准备订购库存,目前销售预测与实际销售情况存在较大出入。当这种情况发生,自动库存管理系统就亟需被修复,但“AI从未经过这样极端的训练”。
在新闻领域,也发生了相关问题。一家新闻网站使用AI评估文章情感偏向,再根据结果提供每日投资建议,但目前新闻比平时都更阴沉,AI给出的建议偏差也较大。
机器模型出现问题很大原因在于,越来越多的企业虽然购入了相关系统,但缺乏维护系统所需的内部知识,而如果想要重新培训一个模型,可能需要专家级的人员重新建设。
当前的危机下,即使是与训练集中的最坏情况相比,现实随时都有可能变得更糟糕。
在Sharma看来,要训练更多AI,除此之外,训练内容应该包括过去的“怪胎事件”,比如20世纪30年代经济大萧条、1987年黑色星期一股市暴跌、2008年金融危机,“这些大灾变是建立更好的机器学习模型的基础”。
但即便如此,也很难做到万全准备。一般来说,如果机器学习系统没有看到它所期望看到的东西,那么就会出现问题。
用AI检测信用卡诈骗的行为分析公司Featurespace创始人David Excell表示,令人惊讶的是,Featurespace没有看到自家AI系统受到太大打击,在他们看来,人们仍然像以前那样在亚马逊上买东西、订阅Netflix,不过,人们不再购买大件商品,也不在新地方消费,这些行为还是足以引起怀疑。
Excell说,公司的工程师们只需要介入调整,以应对购买园艺设备和电动工具的人激增的情况,这些属于欺诈检测算法可能会发现的那种中间价格异常的购买行为。
“世界变了,数据也变了。”Excell说。
AI亟需修正,亚马逊也逃不出这个命运
伦敦的Phrasee正在动手修改他们的AI系统,该公司使用自然语言处理和机器学习技术代表客户生成电子邮件营销文案或Facebook广告,保证文案语气的正确是工作中相当重要的一部分。在工作时,AI能生成大量短语,通过神经网络运行后挑选出最佳结果。
但是,鉴于生成的语言可能出错,在平时,Phrasee也保持让人类来检查其输入和输出的习惯。疫情爆发后,Phrasee意识到,在语言的使用上需要比平时更敏感准确,于是他们开始着手过滤额外语言,禁止了一些特定的短语如“going viral”,不允许涉及被叫停的活动如“party wear”,甚至删除了可能会被解读为高兴或惊险的表情符号,以及可能引发焦虑的词,如“OMG”“be prepared”“stock up”“brace yourself”等。
然而,作为整个零售行业的一个小小的分支,很多企业无法与亚马逊抗衡,但这也是最微妙的地方。随着亚马逊和其250万第三方卖家努力满足市场需求,亚马逊正对其算法进行细微的调整,以帮助分担卖家的负担。
毕竟,大多数亚马逊上的第三方卖家都是依靠亚马逊的算法创造收入,卖家将商品存放在亚马逊仓库里,亚马逊负责所有的物流,包括送货到家、处理退货等。交易完成后,亚马逊会推广完成订单的卖家。
例如,你在亚马逊上搜索Switch后,顶部显眼的“添加到购物篮”按钮旁边的结果更有可能是使用亚马逊物流的供应商,否则就会被排到更后面的位置。
但在过去几周里,亚马逊上这一情况出现了180度扭转,为了缓解库存压力,亚马逊的算法现在似乎更倾向于推广能自己发货的卖家。
市场动荡,人为干预不可少
如果没有人工干预,要实现这种调整是很难的,“情况太不稳定了,上周算法工程师还在努力优化卫生纸,这周大家突然就都想买拼图或健身器材了”。
亚马逊对算法进行的调整随后影响到在线广告上的投入,这些算法决定花在广告上的金额取决于无数变量,但最终决定是基于用户对其有多少价值的估计,这其中,有许多方法可以预测客户的行为,包括有关过去购买的数据,以及广告公司根据不同人的在线活动进行的推荐。
但是现在,Cline说,想要预测点击广告的人是否会购买产品,最佳的参考因素之一就是送达时间,这也是Nozzle在和客户讨论调整算法时提出的意见。例如,如果你认为你不能比竞争对手更快地交付产品,那么想在广告拍卖中超过他们,所进行的花费可能就是无效的。
这一切只有专业团队才能做到。Cline认为,目前的情况让很多人大开眼界,很多人以为自动化系统都可以自己运行,“但实际上,你需要一个数据科学团队,从而把社会事件和算法事件联系起来。一个算法永远也不会主动挑选出这些东西”。
现在已经步入了万物相连的时代,从疫情中已经可以广泛地感受到,这也触动了在更典型的时代仍然隐藏着的机制。如果要寻找一线生机,那么现在正是时候对新暴露出来的系统进行盘点,同时弄清楚如何设计得更好,使系统更有弹性。
如果要信任机器,我们就需要对它们进行监督。
【本文是51CTO专栏机构大数据文摘的原创译文,微信公众号“大数据文摘(id: BigDataDigest)”】
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )