机器学习在反洗钱领域的应用与发展

扫描分享

本文共字，预计阅读时间。

近年来，国际上普遍认可和明确支持大数据、机器学习等新技术在合规领域尤其是金融犯罪风险防控方面的应用。本文重点阐述了以机器学习为代表的新技术在反洗钱领域的应用价值及发展趋势。本文指出，机器学习已成为当前金融风控领域创新探索和方法研究的重要方向。

文/工银亚洲内控合规部主管刘传会，清华大学国家金融研究院特约研究员汪小亚，工银亚洲内控合规部合规经理郭增辉

全球范围内，机器学习、自然语言处理、知识图谱等智能技术正在深刻改变着各行各业，而金融行业率先获益。近年来，国际上普遍认可和明确支持大数据、机器学习等新技术在合规领域尤其是金融犯罪风险防控方面的应用。2018年12月美国联邦储备委员会、联邦存款保险公司、财政部金融犯罪执法网络、货币监理署和国家信贷联盟署发表声明，鼓励银行业采用人工智能等新技术形式来防范金融犯罪威胁。国际知名专业组织公认反洗钱师协会（ACAMS）也频繁发布文章，介绍机器学习等新技术在反洗钱、反恐怖融资等领域的发展情况。本文重点阐述以机器学习为代表的新技术在反洗钱领域的应用价值及发展趋势。

机器学习的主要技术

机器学习（Machine Learning，简称ML）是目前大数据、人工智能领域的核心技术，被普遍认为是实现机器智能的主要途径，它是涉及线性代数、概率论、信息论、数值计算、算法理论等多个领域的一门交叉学科，研究内容为如何使计算机通过有效模拟人类学习来获得新的知识或技能，即通过数据处理、特征工程、模型训练和模型验证等工作程序完成机器学习模型的创建，并在模型成果的实际应用中持续对其实施训练和调优，以不断提高预测和判断的准确性。机器学习算法目前被定义为是一种能够从数据中学习的算法，它直接从数据中“学习”信息，而不依靠预定的方程模型、经验策略，当可用于训练和学习的样本数据增多时，算法性能和模型精度可以得到相应提升。

机器学习目前主要包括三种类型的技术：监督学习、非监督学习和强化学习，其中监督学习是根据已知的数据和结论来训练模型，使模型具备预测或分类的能力；非监督学习不强调输入数据的性质、结论，主要用于找出数据中隐藏的信息和规律，如数据结构、关联关系、群组特性等；强化学习则不依赖原始数据，而是不断借助场景反馈和评价机制实现策略的积累和改善。就反洗钱而言，目前监督学习和非监督学习这两种机器学习技术均有可以应用的工作领域，并且具有大幅改变现有工作模式的潜力。

实际上，机器学习已成为当前金融风控领域创新探索和方法研究的重要方向。因为机器学习算法可以实现对人工风控分析、判断行为的良好拟合，金融机构寄希望将机器学习为核心的人工智能技术应用于风险监测、投资决策、业务审批、自动化交易、客户服务等场景，以降低运营成本，同时提高自身风控能力、盈利水平和市场竞争力。特别是，在反洗钱、反恐怖融资、国际制裁等合规领域，基于机器学习智能模型的系统引擎已经逐步应用到风险评估、交易筛查、交易监控等具体风险控制场景，并显示出了传统规则引擎无法达到的监测效率和有效性水平。

反洗钱监测手段已进入新技术应用阶段

本文将从反洗钱风险监测手段的总体发展进程、系统引擎结构演变两个方面讲述机器学习技术未来在反洗钱领域的应用趋势。

反洗钱风险监测的发展趋势

反洗钱风险监测已经历了纯人工判断、规则策略引擎、量化指标引擎（Scoring）这几种方式，并进一步往机器学习模型（智能）引擎方向发展。以制裁合规风险监测手段的发展为例，包括七个阶段（如表1所示）。

目前传统银行业大多处于第4阶段往第5阶段过渡的进程中，其中部分技术较先进、更具前瞻性的银行已经跨入第5阶段，而具金融科技优势的互联网金融公司普遍已经处于第5阶段，并开启了对第6阶段的探索。在反洗钱、反欺诈的其他如客户洗钱风险评级、交易监控等工作场景中，所使用的风险评估和监测方法也大致遵循与制裁合规风险监测手段一样的发展进程，只是各不同领域的场景多样性和模型复杂程度不同，所使用的基础数据和机器算法有差异，例如在交易监控方面，非监督学习算法更有利于发现新型犯罪活动特征。

在机器学习技术应用于金融风控以前，金融机构重视传统的风险管理及监管合规习惯，设计和选择风险监测手段时将方法原理的可解释性作为一个重要关注方面，这期间的监管考核也以规则的原理解释与证明、个案审查为主要手段。

随着金融业务模式的发展，基于规则策略的传统风险监测方法在准确性和处理效率方面遇到困难，越来越不适应线上业务发展和海量交易数据处理要求，如反洗钱系统有效性提升速度不及业务规模增长速度，则须使用更多的人工处理来弥补系统能力缺失，给金融机构造成持续增长的人力成本压力和越来越大的操作风险敞口。机器学习模型引擎的出现是为适应互联网在线业务特点及满足海量交易监测需求，以准确性和高效率为目标；基于人的判断行为训练监测模型，风险识别过程不易受外部因素干扰，理论上可实现比人工更加精准的判断；但是，机器学习模型的原理及细节不易解释，尤其在使用深度学习技术后，将可能使模型彻底不可解释，所以机器学习技术应用须获得监管环境的许可和支持。同时，为适应新的风险监测手段，金融监管的考核方法也逐渐向反洗钱系统有效性测试、模型训练及测试过程审查的方向转变。

反洗钱风险监测的三种引擎结构

基于机器学习技术的模型引擎的持续发展，并不意味着传统规则引擎将迅速失去价值，一些好的分析方法如离群点检测、时间序列算法等将在反洗钱、反欺诈等领域持续发挥重要作用，与机器学习（监督学习、非监督学习）模型一起共同完成风险特征的识别和甄别任务。所以，预计未来几年反洗钱规则引擎与模型引擎将同时存在于反洗钱系统设计中，主要采用的架构方式应以串行引擎、并行引擎以及混合引擎三种为主。

串行引擎。串行模式是最易实现的一种引擎结构，也是大多数金融机构在新技术探索时首先想到的应用模式，因为这种结构完整保留了规则引擎的作用，且底层结构（算法、规则、数据映射关系等）无须进行调整，依然是通过规则引擎对内部数据实施筛查和监测。规则引擎报警结果作为模型引擎的输入，仅使用模型引擎对规则引擎输出信息进行风险分类，同时模型引擎也可以参考外部数据信息（如有且适用于风险判断）在处理一级（Level 1）报警的同时协助减少二级（Level 2）的甄别工作量。

监管方面，由于串行结构实际是继续沿用了传统的策略方法，其中基础算法、监测规则、量化指标体系仍继续发挥关键作用，模型引擎只是起辅助作用，所以整体的系统原理仍具有很强的可解释性。

并行引擎。并行引擎结构即同时使用规则引擎和模型引擎对客户和交易数据实施扫描和监控，这种模式需要对系统底层功能进行适当改造，以满足模型引擎的数据需求。在这种结构模式下，金融机构可有效发挥规则引擎和模型引擎的协同作用，使风险防控措施变得更加严密，实现更加有效的风险识别能力；可以根据不同场景的风险因素、重要性程度，选用最适合的搜索引擎；根据自身对数据和新技术的应用能力、风险环境变化、监管环境变化来灵活调整规则引擎、模型引擎的决策权重。

监管方面，并行模式仍保留了规则引擎的完整结构，如反洗钱工作流程和方式不发生较大改变，只是使用模型引擎强化风险识别能力，那么这种模式下的系统原理仍具有较强的可解释性，甚至可以做到没有任何衰减。但是，为了提升系统有效性和任务处理效率，模型引擎所占决策权重将不断增加，这将降低系统原理的可解释性。

混合引擎。一个较完善的反洗钱风险监测系统最终将采用混合引擎结构模式（如图1所示），虽然规则引擎功能在这种模式下可能被弱化，但是它的优点和长处并没有被完全舍弃，同时采用机器学习等新技术来最大限度地模拟人工判断，又在核心引擎外基于流程逻辑和新技术实现了更加丰富的智能模块（包括复杂网络、外部数据等的合理运用），通过充分挖掘内部数据和外部信息价值，借助新技术突破系统能力瓶颈，使反洗钱系统有效性上升到新的层次，以释放更多人力资源，彻底改变反洗钱工作方式。

监管方面，混合引擎模式将使系统原理、风控方法的可解释性大幅降低，尤其是在使用了深度学习、自然语言处理等技术后，所实现的判断和预测模型将很难解释，所以混合引擎模式的实现需要以监管对新技术的认知与支持为基础，最明显的标志是监管机构具备了对新技术模型的检测能力。

在上述3种引擎结构模式中，串行和并行引擎模式处于反洗钱风险监测手段的第5个发展阶段（胖引擎和弱智能引擎），混合模式属于第6个发展阶段（瘦引擎和智能引擎）。预计接下来几年，金融机构将在串行和并行引擎结构模式上进行研究和探索，监测手段大多处于第5和第6两个发展阶段。此外，个人信息保护、使用方面的法律限制也是影响金融机构利用外部信息、复杂网络及实现一体化智能风控引擎的关键因素。

机器学习在金融科技和监管科技中的应用

机器学习已成为发展金融科技的重要支撑

近年来，受强劲的互联网创新能力驱动，各金融机构加紧推进金融科技开发与应用，一些具备前瞻性思维的金融机构已经开始尝试在反洗钱、反欺诈等风险监测领域及信用审批、智能投顾等业务领域应用机器学习、数据挖掘、知识图谱等技术，有的已经具备了一定的技术、场景和数据积累，并且一些机器学习模型已经在其实际经营活动中发挥着重要作用，实现了人工经验和专家规则系统无法达到的风控效果、管理效率和收益水平。

银行业加大研究反洗钱机器学习智能模型

汇丰银行开始研究反洗钱机器学习智能模型。2018年4月，英国《金融时报》报道汇丰银行正在引入英国金融数据分析服务提供商Quantexa公司的人工智能方案以协助其扫描海量客户及交易数据，从中发现洗钱、欺诈以及恐怖主义融资行为，作为最新采用人工智能技术解决金融犯罪问题的银行，其处理效率将得到提升而有关成本较人工处理更低。2018年下半年，汇丰银行与知名咨询公司毕马威（KPMG）合作，共同研究和训练反洗钱机器学习智能模型，此类模型将用于反洗钱系统报警的风险分级和自动处理。

平安集团加大机器学习技术平台的基础研究，在大数据和机器学习等基础研究方面的资源投入、人才汇聚和技术积累，为其智能化转型和升级提供了关键必要的支持基础。平安集团反洗钱部门目前已具备较强的反洗钱风险监测规则和新技术模型开发与维护能力，该公司正在现有基础上不断加大机器学习等新技术在反洗钱、反欺诈领域的应用力度和资源投入。

部分银行选择外购和合作研发的方式探索机器学习在反洗钱中的应用。一些技术实力较强的银行正在自有新技术平台上开展基于机器学习和大数据技术的反洗钱、反欺诈智能模型的研究和探索，部分模型已经投入实际应用。而一些没有新技术和数据储备的中小型银行，特别是一些城商银行，也开始尝试借助外部现有新技术方案和信息资源数据库提升反洗钱、反欺诈能力。目前在中国内地提供此类服务的服务商主要有同盾科技、邦盛科技、第四范式等技术公司，以及SAS、KPMG等一些全球知名软件厂商和咨询公司。这些外部服务商在反洗钱方面一般以提供复杂网络（含外部数据库）和模型方案为主，而在反欺诈方面则提供规则、模型、复杂网络等各类解决方案，他们与内地小型银行之间建立了较多的智能方案服务关系。

互联网金融引领反洗钱科技手段创新

互联网金融公司有着很强的模式创新和技术研究能力，在产品运营、流程效率、机制灵活性等方面较传统金融业有较大优势，它们在反洗钱、反欺诈领域处于技术领先地位，对模式变革发挥着引领作用。其中以百度、阿里巴巴、腾讯三家公司旗下的百度金融、蚂蚁金服和财付通最具代表性。

在交易监控方面，百度金融持续升级交易监控系统，通过可疑交易识别模型来提炼自然人客户和商户客户交易的可疑特征，用于识别涉毒、地下钱庄、非法集资、套现等异常交易。同时，在传统监测规则的基础上进一步引入机器学习方法，所实现的新技术模型具有自动化调优能力和高特征维度特点，涵盖了交易金额、交易笔数、交易集中度、手机设备被操控等风险特征。

在客户风险评级方面，百度金融跟随行业发展趋势将客户风险评估因素分为动态因素和静态因素两类，未来还计划引入大数据画像，实现从人生阶段、消费水平、个人兴趣等方面实施更全面的客户风险分类。其中，引入动态风险因素是当前客户风险评估的普遍认可做法，但使用大数据画像特别是外部信息的使用作为下一步发展趋势还要考虑各国政府和金融监管机构在个人信息保护方面的法律要求。

蚂蚁金服将金融科技应用于客户身份识别、异常活动监测、流程高效管理，在具体业务流程中应用智能分析服务实现反洗钱风险防控，来提高甄别能力和工作效率，包括两个方面：一是使用大数据关系网络，直观展现客户资金链路和数据分析结果，实现洗钱风险的快速定位与识别；二是通过机器学习模型学习甄别人员经验，由智能模型对可疑交易报警进行自动分析，以提高甄别审查效率。

财付通利用大数据、人工智能实现其反洗钱系统，根据保险、基金、证券、银行等业务领域的业务逻辑和客户群体来搭建不同的基础模型，其主要金融科技支撑平台包括大数据平台、机器学习平台和知识图谱。其中，大数据平台用于实现数据自动整理，在事中监控环节确保时效性和准确度；其机器学习平台用于组合各种数据源、算法、模型等，高效开展模型训练、评估及预测；而通过知识图谱技术建立起的大规模知识库，使反洗钱系统对风险的定义和定位更加全面和清晰。

机器学习已成为提高监管技术的重要手段

2018年以来国际上快速普遍认可和明确支持大数据、机器学习等新技术在合规领域尤其是反洗钱风险防控方面的应用。公认反洗钱师协会（ACAMS）近来开始频繁在其会员期刊上发布文章，讲解机器学习等新技术在反洗钱领域的应用价值和发展趋势。并且，美国联邦储备委员会、联邦存款保险公司、财政部金融犯罪执法网络、货币监理署和国家信贷联盟署于2018年底发表声明，鼓励银行业采用人工智能等新技术形式来防范金融犯罪威胁，这更加引起了国际上、行业内对新技术在合规领域应用的关注。

香港作为重要的国际金融中心，具备成熟完善的监管环境，特别是在反洗钱方面，香港政府制定了非常严格细致的法例和监管指引，其反洗钱监管要求和行动标准在国际上具有代表性。在技术应用方面，2018年以来香港政府及银行业监管机构香港金融管理局继续推进本地金融科技（Fintech）、监管科技（Regtech）的发展，从多方面采取了一系列准备和支持措施，其中对监管科技有重要意义的主要有三项：一是香港在2018年3月生效的修订版反洗钱条例和反洗钱指引——《打击洗钱与恐怖分子资金筹集条例》与《打击洗钱与恐怖分子资金筹集指引》——中放宽了对于未现身客户核实信息的获取方式限制要求，此举可以被看作是监管部门已接受并支持使用更广泛的技术手段开展客户尽职调查，为后续使用大数据、复杂网络、新技术模型开展反洗钱了解客户规则（KYC）及客户风险评估打下了基础；二是2018年4月底，香港政府在首次发布的本地反洗钱风险评估报告中，明确指出支持金融机构使用创新方法，借助科技及分析工具来实施有效的反洗钱风险管控；三是香港金管局于2018年5月就个人贷款业务的信用风险管理向银行发出指引，允许银行在审批该类业务时无须硬性遵循传统的审批方法，可以应用金融科技如大数据、行为模式分析来审批和管理信用风险。这也是香港监管机构允许金融机构使用新技术评估手段的一个明确信号。

关于重视机器学习在反洗钱领域应用的几点建议

金融机构应积极应对日益增加的反洗钱压力

由于反洗钱、反恐怖融资、反欺诈等风险防控工作是智力的较量，金融机构经常面对的是精心策划的犯罪方法、有组织的犯罪活动。近年来随着技术、渠道和金融产品创新的快速发展，犯罪分子使用新技术（甚至包括智能技术）、通过新渠道、利用金融机构实施的犯罪活动越来越多，违法手段和实施方法不断创新，新式犯罪活动层出不穷，令金融机构防不胜防，对金融机构自身利益、客户利益甚至地区金融系统的安全稳定带来很大威胁。而与此同时，各国对制裁合规、反洗钱、反恐怖融资、反扩散融资等的监管政策和行动标准日趋严格，有关国际组织、各国政府均希望金融机构加强对新技术的掌控和应用能力，推动风险监测手段的发展，持续提升监测系统的有效性，以应对外部风险环境变化，维护共同利益。

金融机构要主动提升反洗钱工作的科技水平

金融科技虽然没有改变金融的本质，监管科技也没有改变合规的本质，但是在具体应用和实现方式上已足以颠覆金融行业目前在用的很多传统方法和普遍流程，对金融科技、监管科技的驾驭和掌控能力将决定未来谁会成为行业的新领袖。在当前线上金融业务、金融科技、监管科技蓬勃发展，同时外部风险环境日益复杂，各司法管辖区监管要求日益严格、监管标准越来越完善的大环境下，反洗钱、反恐怖融资、反扩散融资、制裁合规作为金融行业的强监管领域，有关职能和风险管控措施也应主动拥抱技术发展、寻求创新变革，才能找到从根本上释放风险压力，突破风控能力和管理效率瓶颈的方法。但同时金融机构也须警惕人工智能热所带来的负面影响，金融机构并非一定要追赶最新的智能化潮流，或者一定要与新技术公司开展风控模型方面的研发合作，而是应从实际问题出发，探索使用符合法律和监管要求的、最合时宜、最贴近自身风控需求的智能技术和创新方式。

机器学习对反洗钱风险管控的价值仍在不断探索中

虽然利用机器学习等新技术升级反洗钱风险监测手段已是大势所趋，但机器学习算法模型在现阶段并不是完美和万能的，它在实际应用过程中依然存在不能忽视的弱点，例如由于它的甄别逻辑来自输入数据，模型在训练、生成过程中易习得数据样本中的干扰因素（如人的习惯、偏见、失误等），这就需要在数据清洗和特征工程阶段使用恰当的数据科学方法来减少干扰。并且，源自历史数据的机器学习算法模型对未来结构性变化没有预判能力和应变能力，监管环境、风险环境或风险策略等基础条件的变化可能导致模型重构，如模型调优不及时也可能带来风险。此外，现阶段即便机器学习监测、甄别模型的测试准确率达到接近百分之百，仍不能保证模型不会在执行反洗钱任务时犯低级错误。以上这些都是我们在未来研究和实践过程中需要面对和解决的问题。

本文刊发于《清华金融评论》2019年4月刊

[Source]

本文系未央网专栏作者发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！

本文为作者授权未央网发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！

本文版权归原作者所有，如有侵权，请联系删除。