大数据时代的金融行业：如何辨别数据“金矿”与“垃圾”？

扫描分享

本文共字，预计阅读时间。

当大数据应用在金融行业中越来越普及，我们注意到，数据的准确性和有效性也越来越重要，直接关系到金融机构的商业决策，以及其在市场竞争中的成败。为了充分发挥大数据应用的潜能，实现最大效益，金融机构需要掌握两门必修课：对数据质量进行辨别和不断强化数据处理能力。

大数据时代的金融行业：服务更深入、更精准

在数字化时代的今天，各种新技术、新业态、新模式不断涌现，推动数字经济的快速发展。数据显示，2018年我国数字经济规模达31.3万亿元，占GDP比重达到34.8%。作为数字经济的重要生产资料，大数据得到了前所未有的重视，成为这个时代创新与发展的重要主题。

在国家和地方政府的大力推动下，中国大数据产业加速发展。根据赛迪顾问研究数据显示，中国大数据产业受宏观政策环境、技术进步与升级、数字应用普及渗透等众多利好因素影响，2018年整体规模达到4384.5亿元，预计到2021年将达到8070.6亿元。

尤其是自2015年上升为国家战略后，大数据在各行各业渗透的速度加快。金融行业是大数据应用的理想场景之一，大数据应用也在逐步深入中，从常见的产品设计、前端销售延伸到监管风险、流程改进等更为复杂的领域，为金融机构的商业决策提供了坚实的数据基础。

例如，在产品设计方面，金融机构利用大数据为不同的客户群体量身定制差异化产品，优化客户体验，同时提高客户粘性。在前端销售方面，大数据可以完善客户画像，辅助精准营销。在监管风险与内部控制方面，大数据的应用广泛，在不同金融领域的应用场景各有特色。

在大数据的助力下，金融行业的服务效率不断提升，服务覆盖范围日益扩大，大数据成为助推金融服务下沉的重要工具。在此情形下，传统金融机构纷纷拥抱金融科技，与各类科技公司达成合作，利用大数据技术革新风控流程，提升其在反欺诈、风控模型、贷中预警、贷后管理、流量筛选等风控场景上的业务能力，满足其转型零售金融业务的实际需求。

实践表明，相较于传统风控将金融行为、账户行为和个人金融行为进行关联，围绕客户所做出的基础性工作，大数据风控实现了传统金融交易数据、客户基础数据同客户行为数据、关系数据、设备数据、生态化数据的有机整合，帮助金融机构更加深入地了解用户，提升了金融机构服务的准确性和有效性。

大数据的准确性建立在数据质量的基础上

大数据应用带来金融服务准确性和有效性的提升，是建立在数据质量的基础之上的。在实际业务场景中，尽管大数据应用给金融机构带来的成效已远超过往，但与人们的长远预期仍相去甚远，究其根源在于数据质量参差不齐，不准确或无效数据的使用容易导致金融机构决策出现偏差，甚至业务风险上升。因此，对数据进行辨别、筛选就显得很有必要。

从数据来源来看，金融机构需要明确数据是否来源于真实业务场景，是否具有普遍的适用性。传统金融交易数据、客户基础数据本就源于金融机构自身的数据沉淀，数据的真实性毋庸置疑，但数据维度过少，对金融机构进一步了解客户帮助有限。

近年来，不少金融科技公司或直接介入金融服务场景，或通过搭建第三方平台支持金融服务落地，其本身也沉淀了海量用户借贷交易数据。这些数据同样来源于真实业务场景，对有志于开拓零售金融场景的金融机构而言将是有益的补充，能够帮助缺乏零售金融经验的金融机构快速了解行业特点，在业务开展中少走弯路。

不同于金融交易数据，客户行为数据、关系数据、设备数据、生态化数据等并非产生于金融交易场景中，业内将这些区别于传统金融数据的有价值信息统称为另类数据。另类数据的异军突起，为金融机构解决信用评级和辅助决策等痛点问题打开新思路，驱动一些金融机构与场景服务商达成合作，或者直接跨界到具体业务场景生态中。

另类数据的来源与形式多种多样，大体上可以分为三大类：个人产生数据（Data generated by individuals），包括社交网络信息、产品评价、搜索记录、购物喜好等；商业过程数据（Data generated by business process），包括商业运输、信用卡使用记录、预定数据、购买数据等；传感器数据（Data generated by sensors），包括卫星数据、GPS定位数据、车辆轨迹、个人运动轨迹等。

对金融机构而言，直接跨界到具体业务场景中获取另类数据的成效不大，更多的时候还是要依靠外部渠道。一些有足够实力的金融机构选择与互联网巨头搭建合作平台，进而实现对用户行为特征的进一步了解。但这种合作往往是双向性的，而不是多向性的，这意味着数据孤岛仍然存在，金融机构获取的数据维度不一定足够丰富。

有些金融机构选择与金融科技公司或数据服务商合作，但部分金融科技公司和数据服务商并无真实业务场景，数据源于与场景服务商的平台合作，同样要解决数据维度问题，只有具备多渠道合作资源，才能确保数据来源的丰富性。无论是与场景服务商搭建平台，还是选择同金融科技公司、数据服务商合作，若非直接从真实业务场景中获取用户特征，均需要对原始渠道进行检查和识别，以确保准确性和有效性不受干扰。

大数据应用的精准性还取决于数据处理能力

确保数据质量只是基础，如何实现大数据应用的精准性，还取决于相关机构的数据处理能力。金融机构每天都会产生大量金融交易数据，以银行业为例，波士顿咨询公司曾有报告指出，银行业每创收100万美元，平均就会产生820GB的数据。这些交易数据就像个金矿，并不是所有的数据都具有价值，只有进行充分挖掘才能产生效益。

过去，以银行为代表的金融机构，数据量虽大但使用深度不高，数据应用技术的响应速度不够快，数据实时性不强，同时还面临IOT、移动端、CRM数据繁杂不统一等问题，这些都成为了阻拦银行业通过数据驱动业务升级的拦路石。

在转型发展零售金融业务后，另类数据的重要性日益提高，金融机构对另类数据的使用也越来越普遍。与传统金融交易数据相比，另类数据规模与传输量更大，数据获取、传输速度更快，数据种类更为复杂，对金融机构数据处理能力的要求有增无减。金融机构需要面对大量看似无意义甚至无关的数据，并对其进行分析和处理，从而得出有用信息或结论。

但由于不少金融机构对于分布式计算、机器学习类和深度学习类基础平台的掌握与应用依然比较欠缺，导致这些金融机构无法从容应对大数据处理带来的压力。目前，市场上有发展比较成熟的供应商，可提供完整的解决方案与定制开发，对金融机构来说，最可行的方案就是通过购买这些产品与服务，在短期内获得较大的技术提升。

需要注意的是，在大数据处理过程中，由于涉及数据采集与获取、数据存储与查询、数据处理与计算、数据挖掘与学习、数据理解与应用、数据管理与扩展等诸多方面，对相关技术供应商的算法优化能力、非标准化知识挖掘能力和高度智能化计算能力均有较高要求，金融机构最好选择实力深厚、熟悉业务场景的的机构进行合作，才能实现效益的最大化。

（文/王培文）

[Source]

本文系未央网专栏作者发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！

本文为作者授权未央网发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！

本文版权归原作者所有，如有侵权，请联系删除。