近几年,随着家庭收入增长,电子商务在中国迅猛发展,个人数据量激增,使得基于互联网的金融服务开始快速发展,形成了一个巨大的市场。与此同时,接受金融服务的群体迅速扩大,服务的场景和用户习惯也发生了巨大变化。
传统金融机构想进入整个大消费金融市场,它得变得“智能”一些。过去两年,一些银行已开始慢慢与金融科技公司从精准获客、产品设计、风险控制、联合建模等方面开始了合作,合作方式逐步深入。
我们认为,“智能”在消费金融业务中的体现应该是“端到端”的,是指依赖于大数据,人工智能等技术,实现从获客、产品设计、风控定价、放款到贷后管理等信贷全流程的智能化。
品钛研究院(ID:PINTECAcademy)分专题就“智能消费金融”进行系列讨论。此前已发布《掰开揉碎了聊聊“智能消费金融”系列——风控篇》为系列开篇。
本文着重介绍智能消费金融体系中模型的角色:
· 预测模型如何贯穿智能消费金融各环节;
· 模型背后强悍的底层系统是怎样的;
· 模型设计如何与各业务线配合。
本文节选自品钛研究院出品的《智能消费金融101》课程内容。
1 数据基础薄弱,传统银行难“系统性”挖掘用户价值
麦肯锡在2017年7月出版的《中国银行业转型与创新系列白皮书》报告中指出,传统银行本身数据基础能力较弱,具体体现在不同部门的数据口径、字段、细致程度都有差异。
传统金融机构里,不同产品的交易数据储存分散、未打通,这导致用户数据难汇总,大量有价值的客户交易行为数据价值没有得到有效利用,造成用户数据与一线应用脱节的情况。
2 数据、预测模型贯穿智能信贷决策各阶段
传统金融机构的这些弱点,刚好是智能消费金融能补足的。
相较传统金融机构数据分散,口径不统一,无法形成系统化决策问题,智能消费金融的预测模型贯穿了贷前(营销,新客申请)、贷中(老客管理)、贷后(客户服务,催收)各个阶段。
营销
营销阶段的预测模型主要解决两类问题:1)客户画像是什么样的;2)要为他们提供什么样的产品。
智能消费金融每一个投放广告决策都有数据支持:响应模型用于预测怎样的客户最可能来申请贷款;估值模型用于判断某类客户能为机构带来多少价值,其中包含对客户逾期、违约风险的衡量,以及对于客户对价格敏感程度的评估。
新客申请
新客申请阶段,智能消费金融需要解决的问题是:判断客户是否有欺诈风险,以及对于欺诈风险较小的客户,如何进行定额定价地为他们提供个性化服务。
欺诈风险分为两种:
一种是三方欺诈,即第三方冒用“申请者”的姓名或身份信息进行申请。目前,三方欺诈主要通过人脸识别等手段进行解决;
另一种更普遍的情况是一方欺诈,即确实是本人申请,但申请者在申请时没有还款意愿,其防范主要是靠模型来判断。
在判定了客户欺诈风险可控的情况下,需要用模型确定适合客户的费率和额度,这里会用到定价模型和估值模型。我们会为金融机构客户计算,如果该机构以某一费率向客户提供消费金融服务,那在估值模型结果下,这位客户为能为机构带来多少价值。
如果做得更精细,还可以评估用户的提前还款意愿。在一些长期信贷业务中,提前还款是一个值得关注的风险。因为从金融机构角度,获取一个客户的前期投入是较大的,如果客户为了避免长时间支付利息而选择提前还款,这个风险是需要金融机构承担的。
老客管理
老客管理阶段,需要用模型对用户贷中行为进行分析。我们在做行为评分(B卡评分)的时候,会用行为模型定期给客户“打分”,判断应该给什么样的用户提额,降额,降费率,或者发优惠券等。
客服
预测模型在客服中的应用,包括:1)识别什么样的客户最容易交叉营销;2)面对可能的客户流失情况,要用什么样的方法挽留客户。
识别适合交叉营销的客户,需要通过转化率模型进行预测。
在挽留可能流失客户时,如果使用模型得当可起到节约客服成本的作用。举一个例子,有的机构可能会遇到客户在申请消费贷款时,流程未走完就放弃申请的情况。
如果没有模型支持,客服需要全量跟进这些客户,但如果模型能做得精细一些,我们可以根据用户的行为判断,哪一些客户在客服跟进的情况下更有可能完成申请,这是模型在节约客服资源方面的一个小小应用。
贷后
贷后催收阶段的模型会预测客户的还款情况,并制定相应的催收战略。
这里需要通过响应模型对客户收到催收提示后的可能性进行判断,此外估值模型也需考虑各种催收方式(短信、电话、VIR等)的成本,帮助催收业务团队寻找性价比最高的催收策略。
从上述的分析可以看到,智能信贷的整个周期——从营销、贷前、贷中、贷后——每一个环节都会有预测模型的参与,这个需要做得非常细致。
3 模型要run起来,少不了强大的技术后台支撑
算法做得精致,是预测模型能很好地服务智能消费金融的重要前提之一,另一个不可少的部分是底层的强大技术后台。
做模型高度依赖于底层数据和底层架构的支持,因为智能消费金融的预测模型是通过数据分析来驱动决策的,而互联网消费金融背景下的决策往往需要在几秒内作出,当系统处理几十个数据源后,如何能秒级地把这些数量计算出来,需要依靠复杂的系统。从数据源的接入,到数据清洗,到最后计算,这些对系统的要求很高。
以品钛的智能信贷决策引擎“读秒”举例,数据通过一个叫做数据服务总线 (Data Service Bus,DSB)的模块接入读秒,DSB主要负责与外部数据机构交互,保证接口的稳定实时有效。
DSB的另一重要功能,是把外部接进来的数据转换为数据科学家想要的变量。因为模型不会读未经加工处理的原数据,DSB会从底层原始数据加工产出一些模型能处理的变量。
DSB的数据会同步传给读秒引擎内的两个重要的模块,商业决策引擎和“秒算”,前者涵盖了包括定价,费率,风控策略等规则,后者涵盖了所有的模型算法。
客户申请相关的流程数据进系统后,数秒之内系统内大致会发生这些事:数据服务总线DSB会给商业决策引擎和“秒算”系统去推计算出来的数据,这其中包含几千个变量。
商业决策引擎首先判断,若申请者不符合一些基本的硬性要求(如年龄过小),前置的规则会直接拒绝用户的申请,此时就不需要“秒算”系统再给他打分了,因为打分也会要消耗一些数据成本。
对于需要打分的用户群体,商业决策引擎会推到“妙算”打分系统(“给我打个分”)调起秒算系统,秒算得到指令后会基于DBS传来的实时数据去打分。
“秒算”系统是品钛自主研发的,其中包含了很多模型和算法。我们在评估用什么算法时,会综合考虑什么样的算法能提供一个最稳定,最有效的模型分。往往会结合传统的逻辑回归方法,以及一些“性感”的方法(如神经网络)。这些算法在系统里面都会交叉起来用。
有打分结果后,这个分数会从秒算系统推回给商业决策引擎,由商业决策引擎判断是否拒绝客户的消费信贷申请,并将客户的风险等级,费率、期限等信息同步给业务端,业务端再展示给客户,系统内大致是这样的一个交互 。
4 预测模型如何与风控、业务线“搭配”干活
模型系统“秒算”需要和商业决策引擎“配合”,是因为,本质上,模型输出的是“度量衡”,其核心是对人的筛选和排序。
比如,当建模型的时候,定义300分的用户对应的风险(坏账率)是5%,之后风控部门会根据这个打分定风控策略。假设风控部想把坏账率控制在5%,那他们可能就会把策略卡在300分左右,因为这个模型300分对应的坏账率就是5%。
如果最终实践中发现,300分客群的风险不是5%,变成了15%的,那就说明这把尺子不准。当然这是一个极其简化的例子,真实情况比这个复杂很多。
总之,模型输出的就是度量衡。如果是风险模型,那这个模型就需要从风险的角度把用户群体进行较好的区分;如果是营销阶段的响应模型的话,那就要从响应率的角度把客户进行较好的区分,以此类推。
5 总结
我们可以看到,已经有不少银行开始寻求数字化转型出路。
2018年6月11日,浦发银行宣布与腾讯开展战略合作。2018年5月以来,中信银行,华夏银行、光大银行、浦发银行四家银行先后与蚂蚁金服签署合作协议。银行希望借助金融科技的力量使其自身在这个瞬息万变的市场中,能继续稳健发展。
传统金融机构有多年积累的品牌,用户基数,用户信任,与合作伙伴的关系网络等优势,目前暂时有所欠缺的,可能还是数据整合、数据处理以及基于预测模型辅助决策的能力或意识。
所以……品钛智能消费金融解决方案了解一下 : )
注:本文图片和文字节选于《智能消费金融101》课程,课程将于近期上线。该课程旨在帮助对互联网时代背景下,消费金融感兴趣的伙伴系统地构建对智能消费金融的基本认识。
“101”的表述沿用了美国大学课程设置的习惯,美国大学课程名称若为101结尾,多表示该课程是某门学科的基础、原理、导论课程。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。