专注金融科技与创新

专注金融科技与创新
专栏国内资讯金融信息服务

大数据时代的金融行业:如何辨别数据“金矿”与“垃圾”?

本文共2855字,预计阅读时间57

当大数据应用在金融行业中越来越普及,我们注意到,数据的准确性和有效性也越来越重要,直接关系到金融机构的商业决策,以及其在市场竞争中的成败。为了充分发挥大数据应用的潜能,实现最大效益,金融机构需要掌握两门必修课:对数据质量进行辨别和不断强化数据处理能力。

大数据时代的金融行业:服务更深入、更精准

在数字化时代的今天,各种新技术、新业态、新模式不断涌现,推动数字经济的快速发展。数据显示,2018年我国数字经济规模达31.3万亿元,占GDP比重达到34.8%。作为数字经济的重要生产资料,大数据得到了前所未有的重视,成为这个时代创新与发展的重要主题。

在国家和地方政府的大力推动下,中国大数据产业加速发展。根据赛迪顾问研究数据显示,中国大数据产业受宏观政策环境、技术进步与升级、数字应用普及渗透等众多利好因素影响,2018年整体规模达到4384.5亿元,预计到2021年将达到8070.6亿元。

尤其是自2015年上升为国家战略后,大数据在各行各业渗透的速度加快。金融行业是大数据应用的理想场景之一,大数据应用也在逐步深入中,从常见的产品设计、前端销售延伸到监管风险、流程改进等更为复杂的领域,为金融机构的商业决策提供了坚实的数据基础。

例如,在产品设计方面,金融机构利用大数据为不同的客户群体量身定制差异化产品,优化客户体验,同时提高客户粘性。在前端销售方面,大数据可以完善客户画像,辅助精准营销。在监管风险与内部控制方面,大数据的应用广泛,在不同金融领域的应用场景各有特色。

在大数据的助力下,金融行业的服务效率不断提升,服务覆盖范围日益扩大,大数据成为助推金融服务下沉的重要工具。在此情形下,传统金融机构纷纷拥抱金融科技,与各类科技公司达成合作,利用大数据技术革新风控流程,提升其在反欺诈、风控模型、贷中预警、贷后管理、流量筛选等风控场景上的业务能力,满足其转型零售金融业务的实际需求。

实践表明,相较于传统风控将金融行为、账户行为和个人金融行为进行关联,围绕客户所做出的基础性工作,大数据风控实现了传统金融交易数据、客户基础数据同客户行为数据、关系数据、设备数据、生态化数据的有机整合,帮助金融机构更加深入地了解用户,提升了金融机构服务的准确性和有效性。

大数据的准确性建立在数据质量的基础上

大数据应用带来金融服务准确性和有效性的提升,是建立在数据质量的基础之上的。在实际业务场景中,尽管大数据应用给金融机构带来的成效已远超过往,但与人们的长远预期仍相去甚远,究其根源在于数据质量参差不齐,不准确或无效数据的使用容易导致金融机构决策出现偏差,甚至业务风险上升。因此,对数据进行辨别、筛选就显得很有必要。

从数据来源来看,金融机构需要明确数据是否来源于真实业务场景,是否具有普遍的适用性。传统金融交易数据、客户基础数据本就源于金融机构自身的数据沉淀,数据的真实性毋庸置疑,但数据维度过少,对金融机构进一步了解客户帮助有限。

近年来,不少金融科技公司或直接介入金融服务场景,或通过搭建第三方平台支持金融服务落地,其本身也沉淀了海量用户借贷交易数据。这些数据同样来源于真实业务场景,对有志于开拓零售金融场景的金融机构而言将是有益的补充,能够帮助缺乏零售金融经验的金融机构快速了解行业特点,在业务开展中少走弯路。

不同于金融交易数据,客户行为数据、关系数据、设备数据、生态化数据等并非产生于金融交易场景中,业内将这些区别于传统金融数据的有价值信息统称为另类数据。另类数据的异军突起,为金融机构解决信用评级和辅助决策等痛点问题打开新思路,驱动一些金融机构与场景服务商达成合作,或者直接跨界到具体业务场景生态中。

另类数据的来源与形式多种多样,大体上可以分为三大类:个人产生数据(Data generated by individuals),包括社交网络信息、产品评价、搜索记录、购物喜好等;商业过程数据(Data generated by business process),包括商业运输、信用卡使用记录、预定数据、购买数据等;传感器数据(Data generated by sensors),包括卫星数据、GPS定位数据、车辆轨迹、个人运动轨迹等。

对金融机构而言,直接跨界到具体业务场景中获取另类数据的成效不大,更多的时候还是要依靠外部渠道。一些有足够实力的金融机构选择与互联网巨头搭建合作平台,进而实现对用户行为特征的进一步了解。但这种合作往往是双向性的,而不是多向性的,这意味着数据孤岛仍然存在,金融机构获取的数据维度不一定足够丰富。

有些金融机构选择与金融科技公司或数据服务商合作,但部分金融科技公司和数据服务商并无真实业务场景,数据源于与场景服务商的平台合作,同样要解决数据维度问题,只有具备多渠道合作资源,才能确保数据来源的丰富性。无论是与场景服务商搭建平台,还是选择同金融科技公司、数据服务商合作,若非直接从真实业务场景中获取用户特征,均需要对原始渠道进行检查和识别,以确保准确性和有效性不受干扰。

大数据应用的精准性还取决于数据处理能力

确保数据质量只是基础,如何实现大数据应用的精准性,还取决于相关机构的数据处理能力。金融机构每天都会产生大量金融交易数据,以银行业为例,波士顿咨询公司曾有报告指出,银行业每创收100万美元,平均就会产生820GB的数据。这些交易数据就像个金矿,并不是所有的数据都具有价值,只有进行充分挖掘才能产生效益。

过去,以银行为代表的金融机构,数据量虽大但使用深度不高,数据应用技术的响应速度不够快,数据实时性不强,同时还面临IOT、移动端、CRM数据繁杂不统一等问题,这些都成为了阻拦银行业通过数据驱动业务升级的拦路石。

在转型发展零售金融业务后,另类数据的重要性日益提高,金融机构对另类数据的使用也越来越普遍。与传统金融交易数据相比,另类数据规模与传输量更大,数据获取、传输速度更快,数据种类更为复杂,对金融机构数据处理能力的要求有增无减。金融机构需要面对大量看似无意义甚至无关的数据,并对其进行分析和处理,从而得出有用信息或结论。

但由于不少金融机构对于分布式计算、机器学习类和深度学习类基础平台的掌握与应用依然比较欠缺,导致这些金融机构无法从容应对大数据处理带来的压力。目前,市场上有发展比较成熟的供应商,可提供完整的解决方案与定制开发,对金融机构来说,最可行的方案就是通过购买这些产品与服务,在短期内获得较大的技术提升。

需要注意的是,在大数据处理过程中,由于涉及数据采集与获取、数据存储与查询、数据处理与计算、数据挖掘与学习、数据理解与应用、数据管理与扩展等诸多方面,对相关技术供应商的算法优化能力、非标准化知识挖掘能力和高度智能化计算能力均有较高要求,金融机构最好选择实力深厚、熟悉业务场景的的机构进行合作,才能实现效益的最大化。

(文/王培文)

本文系未央网专栏作者天机风控发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

用微信扫描可以分享至好友和朋友圈

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。

发表评论

发表评论

您的评论提交后会进行审核,审核通过的留言会展示在下方留言区域,请耐心等待。

评论

您的个人信息不会被公开,请放心填写! 标记为的是必填项

取消

天机风控

11
总文章数

天机专业一站式风控服务平台,多年来持续深耕金融科技领域,沉...

大数据行业风波,中小银行不能再“装睡”了

李林鸿 4小时前

风暴眼中的大数据风控

李林鸿 10-09

数据缓存、反欺诈App,有啥法律坑?

肖飒 10-09

大数据行业,最怕的法律风险是啥?

肖飒 09-29

什么是数字经济时代的“石油和发动机”?

孟永辉 09-29

版权所有 © 清华大学五道口金融学院互联网金融实验室 | 京ICP备17044750号-1