TalkingData崔晓波：数据及人工智能在金融行业的应用仍处于早期阶段

扫描分享

本文共字，预计阅读时间。

12月7日，TalkingData CEO崔晓波在清华大学金融科技研究院主办的中国金融科技大会·金融深科技论坛上发表了精彩演说。他认为，金融行业数据及人工智能的应用需要经历四个阶段：业务流程数据化、数据资产化、应用的场景化和整个流程的自动化，而目前还处于初级和早期的阶段。此外他表示，目前数据应用的安全合规问题已经到了无法忽视的阶段，下一步真正值得注意的研究方向是数据如何联通和共享。

TalkingData CEO崔晓波

以下为演讲全文：

尊敬的廖院长、各位领导以及嘉宾，非常高兴有这样一个机会，跟大家分享TalkingData我们在金融以及大数据、科技相结合的领域最近观察到的趋势，包括我们觉得更本质的问题。

首先今年各个金融企业都在应用各种AI、人工智能的技术，包括生物识别在人脸，最近我们和腾讯的团队与一家银行已经完成了整个刷脸支付验证的环节，效果是非常明显的，等候时间降低了30%，对整个销售额预测模型算下来的话，整体会提高收益15%。确实，科技现在对整体业务的影响已经非常大了，包括我看现在各个券商和银行也在积极跟进相关业务，像智能客服、智能投顾等等以及推荐引擎等等一些业务，而且这还只是我们看到的。

昨天跟一位领导也在交流这个问题，领导问我什么叫AI？有点把我问住了。每个公司的理解不一样，但我觉得现在我们用的技术，大部分还是属于感知计算。实际上我们是通过AI的技术，把我们对世界的理解做数字化的过程，是这样一个阶段。但是，对于金融企业来说，我们觉得这并不是问题的本质。问题的本质是什么？我觉得特别简单。一个金融企业，每天你都要做几百万个决策，各种决策：你要不要放款给这个人、你要不要上这个产品、你的营销活动怎么执行等等。不幸的是，绝大部分决策不是高层领导做出的，是由于你们的中层管理者、一线人员做出这样的决策。所有这些决策，大部分人是靠经验、直觉做出的，不是数据驱动的。

所以，这是我们金融企业实际碰到的问题。如果我们跟互联网公司对比的话，我觉得其实所有的金融企业都要经过4个阶段：

阶段1，所有的业务流程必须数据化，能够用数据表示和驱动。

阶段2，要把所有的数据资产化。如何资产化，这是谈了15年的话题，无数的公司发布了所谓的数据资产产品，其实没有一个击中本质的。因为数据资产化的核心是要把它商品化，如何商品化，其实大数据领域经过了data at service这样一个阶段的发展，到现在data access at service的发展，最后大家慢慢意识到数据集是不能做资产的，只有模型、算法有可能成为数据商品被资产化。所以，这是大部分金融企业在建AI创新中心、在建模型，这是核心的问题。更重要的是，你在场景上能不能形成闭环，能不能验证出这些模型对于你金融企业的商业价值到底是多少，这是我们下一步还要努力的方向。这一步，坦率的说互联网公司也没有完成，包括BAT，他们只完成了业务流程的数据化。

阶段3，行业里已经有一些领先企业真正在应用了，我们叫应用的场景化。这非常复杂，我们最近也在跟银行合作，因为银行也在上智能客服、智能投顾。我们最近做了一个测试，我们用了大量的关系点数据优化它的聊天机器人，实际上对它效果的提升是非常明显的。更多我们效果结合一些社交的场景，一些新的能够更符合人认知的场景，可能它的效果会更明显一点。

阶段4，现在还远远达不到，我觉得未来就是整个流程自动化。现在是人机协作的时代，未来如果你的数据智能进一步发展的话，毫无疑问大量的算法和model会慢慢替代你那些中层一线人员做决策，减少失误、降低风险、提高效率，一个企业的业绩自然会上升。

这是我们对整个金融行业目前数据应用以及人工智能后续发展的理解，而不是现在大家看到的表面人脸识别、声纹识别等等场景，这些只是最初级、最早期的，我们认为这是感知计算的领域，这是我们对数据的一些理解。

第二，我最近也去国外很多次，刚才坐在那里还有同事问我，说听说你们跟MIT、斯坦福都有合作，你们在做什么？其实我们现在只聚焦于一个领域，就是数据安全。因为我们做了很多数据应用、数据项目之后我们发现基本的问题没有被解决，做完之后，所有的数据系统它的数据还是无法联通，所有的数据系统还是没有办法协同工作，不管是智慧城市、新零售以及新金融全是这样。问题的根出在哪里？其实是出在安全上的。因为所有的实体包括最近当几个部委在建国家大数据平台的时候，你会发现这个部不跟那个部共享数据，但是他们的理由都是非常一致的，他们的理由是隐私问题。然而背后的问题我们不去深究，往往不是隐私问题，为什么会产生这样的问题？其实我们的安全框架不够扎实。

我们最近推出的安全框架，第一，我们觉得最底下是compliance，我们希望跟五道口学院进一步探讨，实际上都有一个合规层。因为现在已经无法忽略了，欧盟发布了GDPR，就是个人隐私的保护条例非常严格，如果你要去欧洲做生意的话，它是罚你总销售额的百分之多少，你如果触犯了个人隐私条例，网信办37号、39号文，包括最近要出的细则，其实都对这方面做出了特别细致的规定。

所以，你如何保证你所有的数据应用就是安全合规的？这其实有很多相关公司在提供相关的解决方案，如何定义这个数据是PI信息、隐私数据，哪些数据要舍弃，哪些数据要做脱敏处理，哪些数据是在安全红线以上的，这得有一套标准，也得有相应的监管手段以及解决方案。

这层解决了再往上走，还是要解决数据联通性的问题，这方面我们也在跟公安部包括网信办在紧密的合作，包括EID方案，包括我们现在在推一个CallID的方案，这是跟MIT合作的。实际上要解决，在法规里定义的都非常清楚什么是隐私数据，但是很多地方是灰色地带。就是大家都拥有很大数据体量的时候，你们的数据怎么做互联、匹配，这个细则是缺失的，我们也需要有五道口学院这样的实体能够向相关的部委以及立法机构去谏言，就是怎么能够权衡产业的发展以及对个人隐私保护的地带，这方面也有很多很有意思的话题。

第二，再往上还有一层，就是合规以及数据打通问题解决之后，数据共享怎么办？因为上周我跟曾鸣、车敏娟也在聊这个问题，他们就想探究一个终极问题，就是数据到底能不能卖，答案肯定是NO。为什么？不止是法规的问题，而核心的问题在于拥有一个巨大体量数据的公司，它永远不会把数据拿出来卖的，为什么？因为那是白菜价，它往往不如做成业务转化有意义。所以，从它的商业哲学上是完全不成立的。据此我们跟MIT我们也合作了像AOPO这样的框架，它的核心是数据不流动，让算法流动，来解决在合作的状态下，如何做数据共享去打通这样的业务。

像这样的技术已经被广泛的应用在政府领域，举个例子，去年我们合作的一个案例，美国政府因为它会收集到很多珍惜野生动物的位置数据，因为它身上都有定位器，所以这些数据会回来。回来之后，很多研究机构希望政府能够开放这批数据给他们做研究用，但是政府就不敢开放。这就很简单，如果开放所有珍惜野生动物的数据，基本上可以被盗猎集团一网打尽了。那怎么处理这个问题？核心就是底下采用区块链技术，所有的查询是可审计的。但是所有的查询做成一个算法库，算法库授权给你的机构用，是由政府以及相关机构、监管部门组成的实体决定算法库是什么样的。所以，他既拿不到特别细节的数据，同时又可以完成一个业务，所有现在的基础框架都会往这个方向走，我觉得这恰巧是我们下一步值得真正注意的研究方向。

[Source]

本文系未央网专栏作者发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！

本文为作者授权未央网发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！

本文版权归原作者所有，如有侵权，请联系删除。