清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

引言

数据要素化的加速和数据要素市场的不断完善与成熟,为我国发展数字经济和建设数字中国注入强大动力。而金融行业是数字经济中对数据要素的需求最大、价值发挥最高的行业。

金融行业挖掘数据要素潜能走在各行业前列。中国人民银行《金融科技发展规划(2019—2021年)》指出:“在切实保障个人隐私、商业秘密与敏感数据前提下,强化金融与司法、社保、工商、税务、海关、电力、电信等行业数据资源融合应用,建立健全数据融合应用机制,实现数据资源有效整合与深度利用”。

在《金融科技发展规划( 2022-2025年)》进一步就发挥数据要素价值明确:“把握数字经济发展新趋势,发挥数据要素倍增作用,将数字元素注入金融服务全流程,将数字思维贯穿于业务运营全链条、强化金融创新的科技武装,数据加持,加快金融数字化转型步伐,全面提升我国金融业综合实力和核心竞争力”。

《2022年金融业数据流通交易市场研究报告》显示,按照最保守估计,金融行业年交易量在数百亿以上。《中国数据交易市场研究分析报告(2023年)》数据统计,中国数据交易行业仍有可观的市场增长空间,预计到 2030 年可达到 5,155.9 亿元

尽管金融行业在数据要素化探索上取得了较为显著的成果。然而,由于缺乏数据确权与定价等基础性制度改革,数据获取存在壁垒,数据质量与金融实际需求匹配差异大等问题仍然较突出。数据要素全周期、体系性、安全技术产品创新等方面,仍然存在诸多堵点,尚未取得根本性突破。距离“数据高效流通使用、赋能实体经济”的目标,仍有较大的差距。

金融行业数据流通存在的问题分析

国家和行业政策环境尚需完善

国家、地方法规和行业标准如何有效衔接,是当前面临的一个难题。国家顶层法规方面,“三法三条例”的数据安全制度框架已经基本成型。三法分别是《网络安全法》《数据安全法》《个人信息保护法》,三条例分别是《关键信息基础设施安全保护条例》《网络安全等级保护条例(征求意见)》《网络数据安全管理条例(征求意见)》。地方法规方面,初步统计,截止到2023年2月,各地出台的数据相关地方性法规合计也超过40部。行业标准方面,2023年7月24日,中国人民银行起草了《中国人民银行业务领域数据安全管理办法(征求意见稿)》,初步衔接《中华人民共和国数据安全法》,并细化明确了中国人民银行业务领域数据安全合规底线要求,填补了本领域数据安全管理制度保障空白,指导数据处理者优质高效合规开展中国人民银行业务领域数据处理活动,履行数据安全保护义务。如地方文件根据国家“三法三条例”也都提到了数据分类分级,但并未进一步提出具体的分级规范以及数据全生命周期的数据安全管理要求,因此各主体参与数据流通时找不到明确的依据,顾虑重重。

数据安全问题日益严峻

《证券日报》曾在2022年初报道,场外黑市上的数据交易异常活跃,我国数据黑市交易的市场规模已经超过1 500亿元。活跃的数据黑市,导致了网络爬取隐私数据、数据泄露等事件频发。根据Proxyrack统计,我国在2022年超过5 000万起数据泄露事件。尽管对该数据的准确性需要进一步确认,但该数据在一定程度上显示出当前我国数据安全的发展态势仍然较为严峻。2022年,7省份数字政务系统受攻击,近4亿公民数据受威胁;40多家国内金融机构的内网交易数据库遭入侵,交易指令和多条内幕信息被非法获取。

数据要素化行业挑战凸出

数据要素化存在确权难、定价难、计量难的三个深层次问题。数据要素“确权难”,主要体现在数据要素属于“财产权”还是“人格权”的范畴,如何平衡保护与利用的矛盾。“数据二十条”提出探索“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”,也仅仅是淡化了数据的所有权。由于数据产权的模糊性、数据生产的复杂性以及数据价值事前评估困难和数据要素被分析利用的“零边际成本”等特性,导致“定价难”。数据要素“计量难”,体现在原始数据无法规模化交易,数据交易市场缺乏合适的交易标的物,因此只能将数据资源转化为数据产品,采用“按次计量”或“按月计量”,而这种转化势必牺牲数据要素的通用性和规模性。

金融行业数据要素化在数据要素化的三个深层次问题之外,存在以下三方面的行业挑战:

第一,数据源合规监管难。数据交易呈现出交易分散、供应商多、数据质量参差不齐、溯源难的特点,缺乏第三方保障。据上海数据交易所统计显示,截止2022年10月,金融行业数据供应商共2 216家。

第二,数据接入时间冗长。数据寻找与协调周期长、数据接入测试繁琐和数据质量无法达到要求,需要花费大量时间二次治理等原因,导致数据接入时间长、效率不高。

第三,数据采购分散。各总行、分行采购分散,数据对接需要逐家谈判,存在价格不统一、重复采购问题。

当前金融行业数据要素的采购模式分析

金融领域数据流通需求旺盛且迫切,部分地方已基于政务数据探索建设金融服务平台,但主要以信息发布和智能匹配为主,且在数据应用方面未做市场细分,对数据的挖掘和利用尚待进一步提升。目前,金融行业的数据采购主要有以下三种模式。

隐私计算模式,存在技术壁垒

截止目前,多家金融机构与数据资源方、数据交易所等机构均在探索“数据可用不可见”的隐私计算、联邦学习或者多方安全计算等计算技术路径。尽管该模式已经取得了一定的价值,但现阶段的最大瓶颈是各隐私计算厂商之间不能互联互通。不同企业机构部署的不同隐私计算产品都有一套自己相对独立的技术标准,很难实现彼此之间的共享与信息交互。

另外,数据共享的成本也大幅提升。根据多家金融机构部署隐私计算平台后反馈,隐私计算成本是正常计算技术的几十倍以上,效率的瓶颈难以满足高并发、高实施的业务要求。再加上法律合规等原因,导致市场对隐私计算技术仍旧存在较大的争议,因此,隐私计算模式的完善与推广,还有相当长的落地探索时间与周期。

“一条龙”授权模式,存在业务壁垒

政府部门牵头的部分金融服务平台,主流的方式是提供从数据资源到数据应用的“一条龙”黑盒模式。该模式的不足之处在于一方面形成业务垄断,造成数据质量低、服务不及时等;另一方面金融机构真正想要的高价值数据不一定能够安全合规获取到,而获取到的数据,发挥的价值却很有限。

安全可信金融数据空间采购模式

基于目前金融行业数据采购量大、场外交易多,目前的数据要素流通存在诸多局限等原因,本研究提出了基于数据金库与数据元件的“安全可信金融数据空间”的采购模式。

该方案以“一元两网、三类市场”为核心理念,通过“数据元件”实现原始数据和数据应用的解耦;“三类市场”结合传统四大要素市场化配置规律,将数据要素市场科学合理的切分为数据资源市场、数据元件市场、数据产品市场,实现数据“资源化、资产化、资本化”。打造金融行业安全可信数据空间,形成符合经济学原理的市场化配置体系。

“一元”就是数据元件,数据元件是通过对数据脱敏处理后,根据需要由若干相关字段形成的数据集或由数据的关联字段通过建模形成的数据特征。

“两网”是数据金库网与数据要素网。重要数据存储在数据金库中,数据金库是在政府监管下采用全面自主安全的技术产品建设的高安全数据存储措施,主要部署在政府、重要组织行业和大型企业,存储原始数据中可能承载国家安全、公共利益、商业机密和个人隐私的敏感信息,如果需要进入流通环节,需要开展分类分级认定工作。

多个数据金库会形成数据金库网,“数据金库(内)网”主要用于实现核心数据和重要数据脱敏脱密形成数据元件的内部流程(类似于专网);数据要素(外)网是基于数据元件,用于实现要素形态数据的社会面流通。

数据金库与数据要素两网之间通过集数据加工与交易于一体的平台进行单向联结,数据要素加工交易平台是横跨数据金库网与要素网节点的平台。原始数据经过该平台的加工和审核,形成可计量、可定价且风险可控的数据元件。这就将低价值密度、高安全风险的原始数据转变成高价值密度、低安全风险的数据要素。再往上,通过数据产权登记平台,实现全国互认的数据确权,然后进入数据空间交易。

总结来说,数据金库(内)网,可以实现“数据资源+数据元件存储”,数据要素(外)网实现 “数据元件搜索+交易”。这套体系保证了统筹数据安全与要素化流通两大核心问题,支撑数据要素安全、高效和跨域流通。

五层架构的安全可信金融数据空间方案设计

安全可信金融数据空间的定义

所谓安全可信金融数据空间,是以数据元件和数据金库为基础,以可信计算和合规措施为支撑,融合原有数据基础设施和数据资源,通过数据空间操作系统和安全治理机制打造金融行业数据空间,实现跨机构、跨地域、跨行业的数据安全合规、共享流通、业务创新,充分释放数据要素倍增效应。

安全可信金融数据空间的五层架构

传统的计算机网络分成五层结构,分别是指应用层、传输层、网络层、数据链路层、物理层。

安全可信金融数据空间,同样是以五层架构和数据空间操作系统为核心,共同构建统一的数据空间技术体系。其中,五层架构包含数据资源层、数据组织层、本体孪生层、决策推演层以及业务应用层,包含了数据归集、存储、加工、融合计算、共享、使用、管理等各数据要素相关完整流程;数据空间操作系统负责对空间资源、任务、调度、交互、权限等进行统一管理,是统筹管理和协作中心。

(1)数据资源层

数据资源层整合来自政府、组织、企业、个人等多个主体的数据,实现将原有数据基础设施数据(如数据中心、各行业不同业务域、互联网等)与数据金库的数据以数据资源、模型结果集、数据元件等方式归集存储,实现融合计算与共享。

(2)数据组织层

包含元件资源融合平台和数据组件。

元件资源融合平台:支撑数据资源与数据元件安全合规的融合共享。从数据产品的定义到发布,保障生产到共享过程的安全合规,以数据元件的方式对外提供共享,并针对空间运营以及共享情况进行统计。

数据组件:数据组件由来自数据空间基础设施的基础数据元件、数据半成品、低密级数据经融合计算构成,通过数据的组织实现共享利用。它包含两大类数据来源,一类是数据金库生产出来的元件,另一类是原有数据基础设施的数据资源经过加工后形成的数据半成品,如数据元件、数据模型等。

(3)本体孪生层

包含空间资源管理平台和技术与本体组件层。

空间资源管理平台:包含空间数据资源的需求对接、资源目录、参与主体以及使用存证等功能,为技术组件、本体组件的开发使用提供统一的管理功能。

技术与本体组件层:构建一系列技术组件以及本体组件,提供非结构化解析、指标管理、标签管理、知识图谱、分类分级、本体建模以及可信链等功能,通过本体孪生技术消除信息不对称。

(4)决策推演层

决策推演层包括决策推演平台和业务组件。

决策推演平台:为以业务目标为导向的数据挖掘和仿真推演提供搜索研判、时空分析以及本体可视化等相关功能支撑,满足面向不同行业需求的决策推演需求,支撑不同行业的数据产品开发与应用分析。

业务组件层:利用数据空间的数据资源,在技术组件以及本体组件的基础上,构建包含搜索、全息档案、规则组件、研判模型、智能报告、业务图谱、智能规则等业务组件,支撑决策推演。

(5)业务应用层

数据融合共享的目的是为了支撑银行、证券、保险等各金融机构的数据应用,数据空间内各参与主体通过业务应用层提供的营销、风控、审计、舆情等多领域应用将空间内的数据产品应用到各自领域的业务经办和管理活动中。

安全可信金融数据空间的价值

安全可信金融数据空间与各地大数据局建设的金融专区以及全国数十家数据交易所、数据交易中心会形成互补关系,是基于共同商定原则的去中心化的数据生态系统基础设施,提供数据交易、数据商服务、运营管理、信息存证、安全保障等服务,实现金融行业企业安全可信的数据流通。

完善合规、安全与基础服务功能

首先,通过建立主体管理、设施管理、数据管理和监督考核等制度,完善确权登记、数据流通、定价与分配、纠纷调解及仲裁等机制,以及《金融可信数据空间建设标准》、《金融可信数据空间数据安全合规标准》等标准,构建合规治理制度环境;其次,在空间要素上,多技术方式共举,实现空间可信、安全、融合、共享。通过身份认证、存证、追溯和监管、规则与协议,实现空间可信;通过数据元件、数据金库、数据安全与合规审核,实现空间安全;通过目录与分类分级、资源元件融合计算,实现空间数据融合;通过供需对接、流通计量、考核,实现空间数据共享;第三,在技术原理上,按照“数据不动计算动、数据可用不可见、数据可控可计量”的技术实现逻辑,实现高效率、多主体在线供需对接、多对多数据安全融合共享。基于数据元件的融合计算解决空间内原始数据不出域,多主体跨域安全可信融合共享;基于数据金库实现数据资源与元件结果安全存储;基于区块链联邦集成技术,构建数据空间可信联盟链,实现身份、目录、行为、合约上链,全程留痕,数据可信可追溯。

丰富数据要素场景,深度赋能金融产业

通过打造以金融行业为核心的多个行业数据空间,丰富金融数据要素的场景,实现深化赋能产业的目的。比如,聚焦国家关注的重点实体经济、创业创新类企业、乡村振兴等重点类产业及客群,通过制度、机制、技术三点互为支撑的创新,激活企业数据信托、个人数据信托等方式,实现数据二十条中的持有权、加工权和经营权的分离。真正实现以“可计量”为核心的数据资产化落地,打破现有的服务边界,推动数据要素价值的复用与金融机构服务的升级,更好地赋能实体经济。

通过建立金融行业数据空间,还可以有效带动跨行业、跨领域、跨层级数据的流通共享,从而激发更为广泛的数据价值。以金融行业数据空间为示范,牵引不同的行业数据空间建设模式趋于成熟,未来会实现其他各行业数据空间的融合互通,以及行业数据空间与通用型、区域性数据交易市场的衔接。

完善数据空间的研究,促进产业创新

金融行业数据空间不仅定义数据生态系统中各方之间的可信赖数据关系,而且创新提出基于“数据金库”和“数据元件”的新五层架构,数据组织层、本体孪生层、决策推演层的研究、探索和应用将极大促进数据的要素化、市场化运作,激活数据流通的新模式和技术创新。

结论

希拉·贾萨诺夫在《发明的伦理:技术与人类的未来》中提出:“新涌现的技术已经不仅仅是一系列无生命的工具,也不仅仅是相互联结、辅助完成任务的系统,而是重新划分了自我与他人、自然与人工之间的界限。技术发明已经渗入了我们的身体、思想和社会交往,改变了我们与其他人和非人的关系”。当前,数据资源作为新时代推动经济发展的“新石油”,数据已经被提升为与土地、劳动力、技术和资本并列的第五大生产要素。打造安全可信金融数据空间,以“数据元件”和“数据金库”为核心支撑,建立健全权责明晰、分级管理的决策、监管、运营系统化的金融数据空间管理体系,以及以数据组织层、本体孪生层、决策推演层为核心的新五层架构体系,推动公共数据和社会数据安全合规融合计算,不仅对推动数据空间的研究、落地、促进产业创新具有深远意义,而且将数字元素注入金融服务全流程,极大发挥了数据要素倍增作用,实现数据资源有效整合与深度利用,真正促进普惠金融与乡村振兴,全面提升我国金融业综合实力和核心竞争力。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。