9月13日凌晨1点,科技界“春晚”苹果新品发布会再次启幕,“双卡双待”、“史上最大最贵”成为吸引大众眼球的焦点。据悉,三款新 iPhone最低 6500 起,最高售价12799元。对此,不少果粉感叹被“暴击”!好在消费信贷时代,不用卖肾也能贷款买手机。不过细心的网友很快就能发现一个问题:我和同事同样的工资水平,为啥人家网上能贷到12799元买最贵的iPhone XS Max,自己只能贷到6500元买“廉价版”iPhone XR?
原来,在智能风控时代,工资水平只是评估用户风险的一个维度,手机等设备标签也是一个重要的维度,比如,周围同事用的是iPhone,而你用的是百元国产机,很可能导致评估落差。当然要建立客户的360度全景画像,需要综合设备标签、地域标签、需求标签、ID标签、属性标签等多维度样本建模分析。
在转型零售金融、消费金融的大潮下,面对新场景,以工资收入、资产、职业属性等为风控考察核心的传统模式已显得力不从心,智能风控用“大数据”重构信用体系,为金融机构转型发展提供了重要机遇。
作为行业“先行者”融360天机深耕金融科技领域多年,依据丰富的数据积累、充足的行业经验沉淀,运用深度学习、迁移学习、NLP等风控建模技术搭建智能风控平台,帮助金融机构克服线上用户精准营销、预授信、风险评估等难题,助力金融机构开拓零售金融、消费金融蓝海市场。
新金融时代,大数据智能风控是核心竞争力,缺乏专业的风控人才是制约金融科技发展的重要因素,为此,不少机构不惜百万高薪招揽高端风控人才。
为了搭建一个行业交流平台,共同探讨大数据智能风控核心热门技术问题,挖掘和培育AI领域高端人才,吸引更多年轻精英进入金融科技行业,8月25日,由全球金融AI第一股融360|简普科技(NYSE:JT)主办、中国工业统计教学研究会、中国商业统计协会数据科学与商业智能分会、DataCastle数据城堡协办的“2018年第三届融360天机智能金融算法挑战赛”正式拉开序幕。大赛面向全球顶尖数据算法开发者,寻求最优解法与人才,一同解决价值百亿的经典风控问题,共同打造高效、安全、可信的金融科技服务平台。
据悉,本届大赛总奖金池高达30万,周期将持续三个月,线上报名截至11月05日,目前正处于火热报名中。为了此次比赛,融360还开放了千万量级的大量脱敏数据,为竞赛选手带来最真实场景下的体验。
基于往届赛题经验,紧贴技术潮流和经典风控问题,本届大赛共设置了三道创新型赛题,分别是“拒绝推断”、“特征挖掘”、“多金融场景下的模型训练”,赛题涉及机器学习、迁移学习、知识图谱、文本挖掘等支撑金融服务背后的技术领域,无论是从赛事的设计理念,还是对技术能力的把握,此次比赛对学术界和行业界都有非常重大的参考意义。
赛题一:拒绝推断
【技术领域】半监督学习、迁移学习
【背景介绍】2016年1月,机构A通过自建风控模型开始放贷,初期获得了良好的收益。随着时间的推移,机构A发现在样本通过率5%不变的前提下,机构逾期率由2016年1月的5%逐步升至2017年7月的15%,大量坏账导致机构A由盈利陷入亏损境地。公司模型人员仔细检查模型,发现其在训练集和测试集上都表现很好,并没有任何异常,百思不得其解 。
在金融信贷场景中,放款机构会通过审核流程筛选用户进行放款决策,机构只能获得放款用户表现数据,对于大量的拒绝用户的还款情况无法获得。随着时间的推移,由此训练的模型在未放款的用户中无法得到效果验证。
但是,金融风控实际业务中却恰恰包含了未通过放款审核的用户客群,导致训练的模型越来越偏离实际情况,致使大量坏账出现,直接带来巨大经济损失。
因此,在只有最优质的放款用户好坏标签的情况下,如何保证建模对所有放款用户和拒绝用户都有良好的排序能力,是金融风控模型需要解决的重要问题。
选手需解答问题:
1、对用户各类信用相关数据进行分析处理,挖掘数据价值,形成建模特征;
2、根据验证样本和测试样本的样本特点,从训练样本中选取合适的训练集,完成建模,保证模型在验证样本和测试样本上的效果。
解决该问题可以是传统的拒绝推断技术,也可以尝试其他机器学习技术,参赛者可自行选择。
赛题二:特征挖掘
【技术领域】知识图谱、文本挖掘
【背景介绍】融360是中国最大的网络贷款平台,平台的一端是上亿个有借款需求的小微企业和个人消费者,另一端是有贷款资金的数千家金融机构和数十万款金融产品,平台的职责是撮合借款用户和贷款,以及提供必要的风控服务。其中重要的一环是对用户的数据信息进行挖掘,进而全方位立体化的描绘用户特征,更好的服务用户及金融机构。这里分为几步:第一步是大数据化,就是把割裂的分散的数据集中在一起,形成数据仓库;第二步是数据的结构化和网络化,即建立主体之间的联系,关联各种属性;第三步是挖掘和推理,即通过文本挖掘、网络的分析计算,得到想要的知识或特征。
本题要求参赛者根据题目中提供的用户表现,通过数据挖掘技术,筛选出有显著效果的特征,并利用这些特征建立模型,从而更准确的预测用户逾期情况。
选手需解答问题:
1、根据数据情况筛选入模特征,明确特征的生成方式及意义;
2、完成建模,保证模型在验证样本和测试样本上的效果。
赛题三:多金融场景下的模型训练
【技术领域】数据挖掘、建模
【背景介绍】通常,用户进入融360平台后,自行选择最合适的金融机构和金融产品进行申请。因此,融360平台积累了大量不同时期、不同金额、不同期限、不同利率、不同市场环境下的借贷订单。在风控建模过程中,如何针对当前市场环境、金融产品选择最合适的用户样本,关系到模型的最终效果及风控流程中的预测能力,直接影响金融机构的盈利能力。为此,大赛提供融360平台上的部分脱敏数据,希望选手根据实际业务情况,解决问题。
选手需解答问题:
1、对用户各类信用相关数据进行分析处理,挖掘数据价值,形成建模特征;
2、根据验证样本和测试样本的样本特点,从训练样本中选取合适的训练集,完成建模,保证模型在验证样本和测试样本上的效果。
此前,融360于2015年、2016年已举办两届天机风控系列赛事,开启了大数据风控领域的赛事先河。大赛吸引来自全国高级学府如中山大学、中央财经大学的优秀学子以及各个行业精英踊跃报名。在往届参赛选手中,许多毕业生直接进入金融科技企业实习,获奖选手更是被全球互联网金融排名前5的巨头以百万年薪挖走。
本届大赛将为前15名队伍提供高薪岗位绿色通道及行业机构认证权威证书,这将成为选手去银行、金融科技公司面试或工作的一个重要加分项。未来这股新鲜血液会给业界带来怎样的影响,我们将拭目以待。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。