大数据: 金融领域的变局者

扫描分享

本文共字，预计阅读时间。

无论从商业还是技术视角来看，“大数据”都引发了很多争议。很难分辨何为真实，何为炒作。大数据为金融机构研发创新性的方案提供了很大的潜力，并可能为其带来显著价值。为了能够攫取价值，金融机构必须借助大数据更好的理解他们的数据，快速获取并且做出有价值的决定。这就要求商业目的、大数据存储和分析方法要一致。

创造价值的一个主要因素是要信任用来做决策的信息。不信任信息源，分析可能就会抛锚；相反，坚定的信任则会帮助其吸引董事会支持大数据分析。随着信息源数量和样式逐渐增多，建立对数据的信任对大数据创造价值变得越来越重要。

金融机构需要建立对大数据的信任并攫取机会。这个报告旨在帮助金融机构理解大数据的技术部分。想要更好的理解金融机构怎么从大数据中最大化利润可以参考：从大数据中攫取价值：在金融领域淘金。

大数据在金融机构中的3V’s

容量、多样、速度——大数据的这3个特征与金融机构息息相关但又充满挑战。他们必须掌握大量数据，但这些数据缺乏结构并且信息源复杂。另外，金融机构需要具有实时处理数据的能力。

容量：大数据就是大

以前，企业用百万兆字节的容量来存储企业数据。现在，存储需要更大的空间，因为公司开始增加存储和调用不同形式的数据：交易和客户明细，贸易数据，博客，音频文件和其他。很多国家的法律规定金融机构必须保存数据10年。历史数据的保存只是对金融机构的要求，这增加了金融机构商业进程的复杂性。一个公司保存的数据可能是音频或者是其他形式的文件，但有一点是必须的，就是10年内这些数据可以被随时调用。

银行和保险公司需要储存、组织和调用大量多样性数据的技术和方法。大数据及其分析可以帮助金融机构利用存储的信息而不仅仅是保存记录。尽管有数据保存的要求，但大多数的金融机构并不会像Google那样必须处理大量的数据。新的大数据技术能够提供解决多样和速度的新方法。

多样：结构缺失和混合源

数据不再是传统的数据形式，也不再只是放在公司的后台部门或者仓库总以备寻找。银行和保险公司正使用多种渠道进行客户互动。客户可以和银行互通邮件，给分支机构打电话咨询，上网搜集信息，用手机进行交易。这就导致数据形式的复杂，不适合传统的表格存储结构。理财顾问必须看大量邮件，了解内容，这样才能找到自己想要的东西。这些结构化和非结构化的数据集合起来就可以了解到客户的全面信息，了解这些不仅需要去后台部门而且得查找客户和金融机构互动的各种方式。

为了能够达到上面说的效果，企业不仅要存储这些信息，还要理解这些信息。这就需要使用搜索技术，这个技术能够搜索非结构性数据，集合这些数据提供有意义的集合给出纳，财富顾问，呼叫中心接线员。最好的信息应该来自于企业内外部的所有构成资产。

多样性的另一方面是要求数据来自组织内部和外部。以前，银行从其集团内部获取所需信息。但是，随着外部相关信息的增加，银行和保险公司需要整理内外部信息，并及时处理这些信息。这就需要强大的内容管理工具。

例如，在法国，公众可以通过www.data.gouv.fr接触到近300000个数据点，这些数据包括国家、公众和政府的各方面数据。越来越多的公司能够使用这个外部信息来营销和服务客户。想想YAGO这种信息源（在萨尔布吕肯的马克思普朗克计算机科学研究所的知识库）。2012年，YAGO2s有超过1000万的公司条目，包括关于这些实体的1.2亿的事件。YAGO的这些信息是从Wikipedia、Wordnet和Geonames自动提取出来的。在一个样本中，YAGO的准确率被评估为95%以上。整个数据库的克隆件、专题及其子集都是可用的。它还可以通过不同浏览器查询。YAGO已经被用于IBM的沃顿人工智能系统。

另外，社会媒体不仅为商家提供了外部信息，同时也有助于督促公司更好的服务客户和改善产品。金融机构可以利用客户在企业外部交流时对产品的评价。例如，银行可以从客户的外部博客和网上客户论坛寻找信息。越来越多的银行和保险公司不得不用云方法把他们的网络和客户社区相连。通过倾听客户和收集反馈，他们可以开发出更快、更贴近客户需求的产品。

速度：来自真实世界的实时数据

数据不再只是关乎编译和处理了。它是来自真实世界的实时数据。美国地震调查局地震推特调度（TED）通过用多种语言分析推特的实时容量，能够用时间、地理标记和推特中的位置数据在30秒到2分钟内精确指出地震点。TED提供的地震警报时间比地震仪确认的信息提前了一半。金融机构现在可以使用实时分析手机和社会数据等分辨出欺诈和正常的信用卡消费。

当世界进入电子交换时代，银行和保险公司需要使用多种渠道进行客户互动。每种通道都需要实时进入客户信息以支持互动，每个接触点都对客户有了新的了解。

每年，很多芯片都被用来收集数据以抵抗欺诈和其他状况。大数据已经改变了保险定价，保险公司可以把芯片放入汽车来收集汽车的信息。保险公司可以根据汽车行为和客户驾驶模式来定价。另一个机遇是用交通、天气和地理数据等信息结合汽车和司机来了解情况。

银行和保险公司需要使用实时数据做商业决定的新能力。例如，银行以前要花3到4天来处理信用申请。现在，一些银行就可以在24小时内完成风险评估程序并反馈给客户。保险公司在5分钟内就可以提供报价及其与其他保险公司的价格对比。你可以通过手机进行保险索赔，包括事故车辆损坏的照片、路边援助、GPS坐标等等。将来，通过提高实时数据分析的能力，银行将不再担心巴塞尔流动性风险，因为它能够在每次信贷决定时基于数据实时重算。

将来会管理哪种数据？可能会提供哪种服务？

传统的数据模型基于样本，因为模型工具不能立即处理所有数据。因此，由于样本偏差带来的潜在错误受到普遍担忧。然而，大数据技术能够处理模型中的所有数据，处理成百上千个情景组合，避免了样本偏差。另外，大数据的技术工具不仅处理大容量，而且处理即时数据，也就是说，可以在很短的时间内进入并处理大量数据。基于规则引擎技术使公司可以设计自己的商业处理规则。这些规则允许处理器自助决定85%到90%的事件。

价值计算

解决容量、多样和速度的技术工具使金融机构建立组织信任和处理大数据创新成为可能。为了能够从大数据中攫取最大价值，金融机构应该通过他们要完成的商业目的开始他们的大数据活动。商业目的应该统治大数据应用的领域。这将有利于确定数据收集的范围，防止收集无用的数据。

现有和未来的法规也是金融企业大数据活动的关键因素。这些法规更多的重点放在公司增加监管、透明度和风险报告上面，这远远超越了以前的要求。

除了遵守法规，金融机构应该将商业目的作为数据管理的严格标准。这样的标准将会帮助公司把大数据转化为价值。

从技术角度，大数据可以根本上降低技术方案持有者的总成本。大部分的大数据技术依赖便宜的商业硬件，所以扩大规模很迅速而且经济。他们也会使用开源软件以避免许可费。这方面降低了整个组织采用大数据分析的壁垒。

更广泛点说，大数据的真实价值很难估计。当部分价值可知的情况下，可以通过数学假设和计算来定义价值。如果结构正确，可以用ROI来计算大数据价值。它也可以用来决定新软、硬件购买平衡点、资源配置和项目优先级。

为了减少资本支出和风险，很多金融机构选择了云技术。端到端的云技术分析（例如凯捷的Elastic分析）能让金融机构利用消费模式的所有优势，感觉就像是在经营自己的数据中心。对于很多正在和数据泛滥斗争和需要对用户新需求做出迅速反应的金融机构，云技术可以让其更有效的进入端对端商业智能和大数据分析方案。

银行、资本公司和保险公司都意识到企业信息是最有战略价值的资产。一些金融机构已经把数据库转移到了企业层面的程序，把信息提升到了战略资产的地位。他们正在把公司重塑为信息中心的企业，领导团队管理着消费数据及其质量。但是大部分的公司也说他们没有重点、技能、能力和领导力来有效的管理这个战略资产。对于很多企业来说，最大的大数据问题就是“我怎么使用它呢？”

[Source]

本文系未央网专栏作者发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！

本文为作者授权未央网发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！

本文版权归原作者所有，如有侵权，请联系删除。