清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

参赛单位:中国银行股份有限公司

案例名称:手机银行实时反欺诈机器学习模型应用实践

案例简介:

面对复杂严峻的欺诈风险态势,为向客户提供更加安全、便捷的手机银行安全服务,加工融合海量数据衍生万维特征,建成基于高维交易行为画像的实时反欺诈机器学习模型,运用“流式计算+批量加工”结合的方式实现模型在高频交易场景下毫秒级实时决策,并与专家模型双核驱动构建以客户为中心的多元化交易安全体系,在提升体验的同时更加精准全面的识别风险交易,为客户提供实时高效、柔性智能的交易安全服务,切实保护客户资金安全。

创新技术/模式应用:

随着商银行数字化转型的加速,手机银行、移动支付等线上数字金融业务在为客户带来了更加高效、优质金融服务的同时,也在反欺诈层面带来了严峻挑战。目前各大银行逐步建立了以风控业务专家设计的规则模型为核心的反欺诈体系,但专家规则模型在欺诈案件的准确识别和在新型案件的识别上均存在一定的局限性。在此背景下我行领先同业率先建成实时反欺诈机器学习模型并顺利投产应用,并荣获《亚洲银行家》杂志“中国最佳人工智能应用”奖,对于应用机器学习算法提升线上金融业务的事中交易风控能力具有推广价值和借鉴意义。

1、机器学习模型研发

模型建立应用RFM(Recency, Frequency, monetary)特征衍生方案和10T+海量多维度数据,通过对不同主体、行为和时间窗口的复杂运算,构建数十万维特征,细致刻画每笔交易特点;应用XGBoost机器学习算法,通过35轮的模型迭代优化,建成适用于高频交易场景的实时反欺诈机器学习模型。该模型通过对每笔交易的细致刻画和历史交易行为的全面“了解”,可以敏锐洞察欺诈风险,向客户提供柔性的安全服务,更加准确、全面的识别欺诈交易,并能有效识别新型欺诈,最大限度地防范欺诈行为的发生,减少对客户的打扰并提升客户资金的安全性,是国内大型银行在高频实时决策场景应用机器学习模型的领先成功实践。

2、模型应用策略

为最大化发挥模型效果,经过大量的数据分析和探索,设计了“模型+规则”组合应用的方案。如表1所示,根据机器学习模型对每笔交易计算的欺诈评分,将全体交易划分为高风险头部区域、中风险中部区域和低风险尾部区域三部分,与专家规则组合决策匹配适当增强认证措施,能够发挥各自的长板切实提升欺诈风险防控效果。

表1 “规则+模型”组合应用策略

3、系统部署方案

为达到毫秒级实时决策的业务目标,在模型的系统部署上采用了X86分布式架构等互联网开源技术,通过“流式计算+批量加工”结合的方案实现:短时特征,以大数据的流技术为依托,利用Spark分布式集群计算引擎,快速、高效的处理实时交易环节产生的海量数据;长期特征,基于大数据平台的历史数据存储和计算能力批量加工。通过短期特征流式计算、长期特征批量加工的创新实践,保障了每笔交易复杂特征的高效快速计算和模型的实时评分决策。

项目效果评估:

1、模型性能指标

针对交易反欺诈场景正负样本极端不平衡的特点,使用AUC和KS评价模型技术性能,使用召回率和误报评价模型业务效果。经实践观察,模型各方面指标均达到较好水平,验证集模型AUC达到0.997,测试集AUC达到0.972,KS值达到最大0.83,召回-误报曲线上升陡峭,业务效果优异。

图2  ROC曲线

图3  KS曲线

误报比曲线衡量的是随着模型误报比(成本)的上升,识别欺诈交易的召回率(收益)提升情况。如图4所示,该模型召回-误报曲线陡峭、上升速度很快,说明模型识别欺诈交易的能力较强,可在较小的客户打扰成本下快速提高欺诈交易的识别能力。

图4 召回-误报曲线

2、模型应用效果

在当前专家规则模型日趋复杂、提升空间有限的情况下,引入机器学习模型可敏锐洞察用户的异常行为。从高维的行为特征角度看,客户的交易习惯是相对稳定的,因此能够敏锐感知异于客户本人操作习惯的欺诈交易。在模型投产后,经持续的生产观察和验证,通过机器学习模型的应用可在月均降低挑战量的情况下,多拦截欺诈交易,实现了召回率和准确率“双提升”的目标。同时模型对新型欺诈案件也表现出了非常强的识别能力,突破了专家规则在新型欺诈风控策略部署滞后上的局限性,一定程度上解决了交易欺诈模式变化快、识别难的风控难题,有效提升了系统的风控能力。

对客户而言,机器学习模型大幅减少了对正常交易的打扰,大幅提升了客户资金安全性和使用体验;对银行而言,降低了人工外呼、人脸认证等增强认证的运营成本,建立了以客户为中心的多元化交易安全体系,进一步提高了为客户提供便捷优质安全金融服务的水平和能力。

图5 模型与规则组合应用召回-误报曲线

3、模型决策时效

模型投产后,经持续观察和验证,“流式+批量”结合的方式有效支撑了机器学习模型的实时决策和生产应用,在客户没有察觉的瞬间就已完成复杂的风险判断,达到了高并发、低延时、高精度、高可靠等业内先进标准。

项目牵头人:

何斌

主管

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。