最有看点的互联网金融门户

最有看点的互联网金融门户
资讯

百万年薪巅峰之战 融360天机智能金融算法挑战赛赛题揭晓

本文共3026字,预计阅读时间112

9月13日凌晨1点,科技界“春晚”苹果新品发布会再次启幕,“双卡双待”、“史上最大最贵”成为吸引大众眼球的焦点。据悉,三款新 iPhone最低 6500 起,最高售价12799元。对此,不少果粉感叹被“暴击”!好在消费信贷时代,不用卖肾也能贷款买手机。不过细心的网友很快就能发现一个问题:我和同事同样的工资水平,为啥人家网上能贷到12799元买最贵的iPhone XS Max,自己只能贷到6500元买“廉价版”iPhone XR?

 

原来,在智能风控时代,工资水平只是评估用户风险的一个维度,手机等设备标签也是一个重要的维度,比如,周围同事用的是iPhone,而你用的是百元国产机,很可能导致评估落差。当然要建立客户的360度全景画像,需要综合设备标签、地域标签、需求标签、ID标签、属性标签等多维度样本建模分析。

 

在转型零售金融、消费金融的大潮下,面对新场景,以工资收入、资产、职业属性等为风控考察核心的传统模式已显得力不从心,智能风控用“大数据”重构信用体系,为金融机构转型发展提供了重要机遇。

 

作为行业“先行者”融360天机深耕金融科技领域多年,依据丰富的数据积累、充足的行业经验沉淀,运用深度学习、迁移学习、NLP等风控建模技术搭建智能风控平台,帮助金融机构克服线上用户精准营销、预授信、风险评估等难题,助力金融机构开拓零售金融、消费金融蓝海市场。

 

新金融时代,大数据智能风控是核心竞争力,缺乏专业的风控人才是制约金融科技发展的重要因素,为此,不少机构不惜百万高薪招揽高端风控人才。

 

为了搭建一个行业交流平台,共同探讨大数据智能风控核心热门技术问题,挖掘和培育AI领域高端人才,吸引更多年轻精英进入金融科技行业,8月25日,由全球金融AI第一股融360|简普科技(NYSE:JT)主办、中国工业统计教学研究会、中国商业统计协会数据科学与商业智能分会、DataCastle数据城堡协办的“2018年第三届融360天机智能金融算法挑战赛”正式拉开序幕。大赛面向全球顶尖数据算法开发者,寻求最优解法与人才,一同解决价值百亿的经典风控问题,共同打造高效、安全、可信的金融科技服务平台。

据悉,本届大赛总奖金池高达30万,周期将持续三个月,线上报名截至11月05日,目前正处于火热报名中。为了此次比赛,融360还开放了千万量级的大量脱敏数据,为竞赛选手带来最真实场景下的体验。

 

基于往届赛题经验,紧贴技术潮流和经典风控问题,本届大赛共设置了三道创新型赛题,分别是“拒绝推断”、“特征挖掘”、“多金融场景下的模型训练”,赛题涉及机器学习、迁移学习、知识图谱、文本挖掘等支撑金融服务背后的技术领域,无论是从赛事的设计理念,还是对技术能力的把握,此次比赛对学术界和行业界都有非常重大的参考意义。

 

赛题一:拒绝推断

 

【技术领域】半监督学习、迁移学习

 

【背景介绍】2016年1月,机构A通过自建风控模型开始放贷,初期获得了良好的收益。随着时间的推移,机构A发现在样本通过率5%不变的前提下,机构逾期率由2016年1月的5%逐步升至2017年7月的15%,大量坏账导致机构A由盈利陷入亏损境地。公司模型人员仔细检查模型,发现其在训练集和测试集上都表现很好,并没有任何异常,百思不得其解 。

 

在金融信贷场景中,放款机构会通过审核流程筛选用户进行放款决策,机构只能获得放款用户表现数据,对于大量的拒绝用户的还款情况无法获得。随着时间的推移,由此训练的模型在未放款的用户中无法得到效果验证。

 

但是,金融风控实际业务中却恰恰包含了未通过放款审核的用户客群,导致训练的模型越来越偏离实际情况,致使大量坏账出现,直接带来巨大经济损失。

 

因此,在只有最优质的放款用户好坏标签的情况下,如何保证建模对所有放款用户和拒绝用户都有良好的排序能力,是金融风控模型需要解决的重要问题。

 

选手需解答问题:

1、对用户各类信用相关数据进行分析处理,挖掘数据价值,形成建模特征;

2、根据验证样本和测试样本的样本特点,从训练样本中选取合适的训练集,完成建模,保证模型在验证样本和测试样本上的效果。

解决该问题可以是传统的拒绝推断技术,也可以尝试其他机器学习技术,参赛者可自行选择。

 

赛题二:特征挖掘

 

【技术领域】 知识图谱、文本挖掘

 

【背景介绍】融360是中国最大的网络贷款平台,平台的一端是上亿个有借款需求的小微企业和个人消费者,另一端是有贷款资金的数千家金融机构和数十万款金融产品,平台的职责是撮合借款用户和贷款,以及提供必要的风控服务。其中重要的一环是对用户的数据信息进行挖掘,进而全方位立体化的描绘用户特征,更好的服务用户及金融机构。这里分为几步:第一步是大数据化,就是把割裂的分散的数据集中在一起,形成数据仓库;第二步是数据的结构化和网络化,即建立主体之间的联系,关联各种属性;第三步是挖掘和推理,即通过文本挖掘、网络的分析计算,得到想要的知识或特征。

 

本题要求参赛者根据题目中提供的用户表现,通过数据挖掘技术,筛选出有显著效果的特征,并利用这些特征建立模型,从而更准确的预测用户逾期情况。

选手需解答问题:

1、根据数据情况筛选入模特征,明确特征的生成方式及意义;

2、完成建模,保证模型在验证样本和测试样本上的效果。

 

赛题三:多金融场景下的模型训练

 

【技术领域】数据挖掘、建模

【背景介绍】通常,用户进入融360平台后,自行选择最合适的金融机构和金融产品进行申请。因此,融360平台积累了大量不同时期、不同金额、不同期限、不同利率、不同市场环境下的借贷订单。在风控建模过程中,如何针对当前市场环境、金融产品选择最合适的用户样本,关系到模型的最终效果及风控流程中的预测能力,直接影响金融机构的盈利能力。为此,大赛提供融360平台上的部分脱敏数据,希望选手根据实际业务情况,解决问题。

 

选手需解答问题:

1、对用户各类信用相关数据进行分析处理,挖掘数据价值,形成建模特征;

2、根据验证样本和测试样本的样本特点,从训练样本中选取合适的训练集,完成建模,保证模型在验证样本和测试样本上的效果。

 

此前,融360于2015年、2016年已举办两届天机风控系列赛事,开启了大数据风控领域的赛事先河。大赛吸引来自全国高级学府如中山大学、中央财经大学的优秀学子以及各个行业精英踊跃报名。在往届参赛选手中,许多毕业生直接进入金融科技企业实习,获奖选手更是被全球互联网金融排名前5的巨头以百万年薪挖走。

 

本届大赛将为前15名队伍提供高薪岗位绿色通道及行业机构认证权威证书,这将成为选手去银行、金融科技公司面试或工作的一个重要加分项。未来这股新鲜血液会给业界带来怎样的影响,我们将拭目以待。


用微信扫描可以分享至好友和朋友圈

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。

发表评论

发表评论

您的评论提交后会进行审核,审核通过的留言会展示在下方留言区域,请耐心等待。

评论

您的个人信息不会被公开,请放心填写! 标记为的是必填项

取消

版权所有 © 清华大学五道口金融学院互联网金融实验室 | 京ICP备17044750号-1