近年来全球欺诈趋势如何演变?潜伏在流量中的欺诈行为有哪些特点?无监督AI技术如何帮助企业风控管理者提升效率?其原理如何解释?如何利用无监督技术建模?
近日,DataVisor维择科技中国区技术负责人崔宏宇做客“51CTO大咖来了”,就上述问题带来分享。现在就让维择课代表带你回顾直播精彩内容吧!
传统行业数字化转型中面临的风控挑战
如今,各大传统行业纷纷开始数字化转型,希望能够借助互联网浪潮加速自身发展。然而传统行业与互联网行业本身存在很大不同:传统行业缺乏互联网基因,对互联网风险的认识也有待加强,因此在转型过程中面临着诸多挑战。
互联网飞速发展使得欺诈模式更加复杂
随着移动互联网技术的发展,单一功能网站转型多功能平台,线上交易行为可能会受到来自多方的有组织攻击,比如撞库、盗号、薅羊毛、虚假粉丝、虚假好友、虚拟货币、洗钱、交易欺诈、钓鱼攻击等。欺诈手法多变,甚至出现多环节联动的情况,多数欺诈行为还会潜伏较长时间来模拟正常客户的行为,使普通风控系统无法检测出异样行为,风控环节面临着巨大挑战。
金融行业在数字化转型的过程中业务范围越来越广,各个环节都存在着被黑产攻击的可能性。在申请阶段存在恶意逾期、中介代办、团伙欺诈等风险;在交易环节中,常见的有盗卡盗刷、养卡套现,甚至洗钱行为;营销阶段的欺诈更加严重,很多金融机构为拉新用户,给新用户发放红包奖励,但是这些奖励很多情况下都流入了黑产的口袋,金融机构因此遭受损失。黑产活动已经渗透到金融业务全流程,这对传统金融行业的风控能力提出了更高的要求。
那么,为何传统金融行业在转型过程中更容易遭到黑产威胁?
崔宏宇说:“打击黑产的过程就是风控人员和黑产之间的一场博弈。”我们可以从三个方面进行解读:
首先是利益驱动方面,黑产的欺诈行为会带来巨大的经济利益,同时受巨大利益驱使会产生罕见的积极性和驱动力,而风控从业人员相对利益奖励远远不足。
其次在分工合作方面,黑产已经形成专业、分工明确的产业链,产业交流频繁,对新技术非常敏感且快速学习迭代。而风控在企业中为成本中心,受预算限制,团队规模相对较小且同行技术交流也没有那么频繁。
最后,黑产仅需在风控体系中寻找个别漏洞即可大规模复制盈利,实现“一招鲜,吃遍天”的单点突破。而对于防守方来说,风控人员需搭建全面风控管理体系,任何一块防范不到位都会出现明显“木桶效应”,做到段时间内拦截欺诈是十分巨大的挑战。
知己知彼:揭秘黑产技术及其新型攻击手段
黑产产业链条
黑产分工逐渐精细化,形成了完整的上、中、下游的产业链条:黑产攻击的第一步是进行大规模恶意注册,然后利用群控软件进行同屏传输与批量控制、自动化运行、虚拟定位、一键新机串号设置、定时任务、万能表单输入、手机分组管理、万能脚本/自定义脚本等手段实现套利。另外,技术迭代后为减少成本,黑产利用安卓模拟器可以在PC端模拟任意手机、修改设备参数、多开模拟、虚拟定位,提高其效率减少人力成本,形成了完整的产业链。
崔宏宇介绍道:“有一部分黑产专门向不法分子提供普通用户个人身份信息,例如将身份证、银行卡、预留手机号、银行U盾打包成四件套,售价800到1000多元不等,这些信息被卖给违法犯罪份子,用来进行虚假借贷等操作,从而获得巨大利益。”
黑产常用工具有猫池、清机软件、安卓模拟器、群控软件、GPS模拟器、云手机等等。
猫池(配合养卡软件)
利用群控软件同时控制多部手机
无监督反欺诈优势明显
技术手段愈加丰富,风控人员与黑产之间的博弈也愈演愈烈。面对快速迭代的欺诈模式,传统反欺诈方案的不足渐渐凸显出来,而无监督机器学习提供了一个比较好的方向。传统的风控手段更多的是被动防范,欺诈损失产生后才能亡羊补牢,而这种反应方式最快也要几个小时。如今,新的欺诈模式层出不穷,在标签数据严重缺乏的情况下,无监督机器学习(UML)成为近年来反欺诈的新宠。
无监督机器学习成为反欺诈新宠
传统无监督机器学习是一种在无标签的数据中提取其中隐藏信息(数据结构和模式)的算法,主要应用于数据挖掘、模式识别,优点是不需要标签。但传统无监督机器学习在应用上同样面临结果难以评估、时间复杂度高等难题,无法很好地满足客户需求。
DataVisor维择科技研发了一套专门应对团伙欺诈的无监督算法,目前已经应用到社交平台的批量注册、电商平台的薅羊毛、APP的虚假注册、金融领域的可疑交易、保险领域的虚假理赔等多样场景。
DataVisor维择科技的无监督机器学习算法在高维特征空间中对用户进行聚类,通过整体分析用户行为,能从不同维度聚类出相似的用户,以此检测出可疑的用户行为。无监督机器学习算法有三个明显优势:一是自动挖掘和检测各种已知、未知的欺诈行为;二是自动产生标签,用于机器训练检测模型;三是自动产生规则,免除费时的人工规则调试。
最后是网友提问环节:
1.无监督算法怎样与规则、黑白名单技术进行配合?
崔宏宇:传统的规则、黑白名单、有监督模型在风控过程中也能起到一定效果,而无监督算法能够从不同角度覆盖更多新型欺诈风险。对于一个比较完善的风控体系来说,规则、黑白名单、有监督、无监督都是必不可少的,多种技术之间可以相互融合。
2.一般企业的业务数据都涉及隐私,DataVisor维择科技是以产品方式还是项目方式为客户服务的?
崔宏宇:现在是两种方式都有,一些敏感行业比如金融行业对数据隐私的要求是非常严格的,这种情况下我们需要去客户的环境进行建模服务。在以产品方式为客户服务时,我们会把无监督建模平台、变量计算平台、规则引擎等一系列产品提供给客户,由客户自己使用。还有一些客户的数据经过脱敏后可以进行云上的分析和处理。
3.每一个具体的欺诈场景是不是都要选择一套合适的算法?
崔宏宇:理想状态下,每一个具体的欺诈场景最好都有一个单独的模型,因为这样模型会专注于这个场景,但是不一定每个场景都需要不同的算法。无监督适用很多场景,例如批量注册、垃圾信息、广告行为这种团伙欺诈行为利用无监督都可以解决。
嘉宾简介:
崔宏宇
DataVisor中国区技术负责人
现任DataVisor中国区技术负责人,自2015年起,在DataVisor开发使用分布式无监督机器学习算法进行反欺诈检测。负责过如Pinterest、Yelp、阿里巴巴和猎豹移动等大型互联网企业的机器注册、虚假评论、垃圾邮件、欺诈交易和虚假应用安装等场景的反欺诈建模 。在模型调优、特征工程和算法开发等领域都有着丰富的经验。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )