清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

毫无疑问,数据正在呈爆炸式的增长。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。随着数据体量的增大,大数据时代悄然来临。

在商业语境下,“从数据中得到价值”并不是一个新鲜的词。几十年前,沃尔玛关于“啤酒与尿布”的故事就展现了数据挖掘的商业价值。但随着大数据时代的到来,数据,或者说大数据,所产生的商业价值已然有了巨大改变。在过去的几年之中,基于数据收集渠道的拓宽,数据处理技术的进步,人们对于如何更好的使用数据,发挥数据更大的商业价值也有了更多的探索和尝试。

站在今天的视角下,大数据的商业变现模式处于何种阶段,大数据的商业价值究竟何在等仍是极具意义的问题。本系列文章,试图从大数据的产业链,大数据在不同行业的应用等多个维度来了解大数据的商业价值,并结合国内外相关案例,以期在当下,探索大数据的商业边界和未来可能的变现模式。本文为本系列的第一篇,阐述大数据是什么,大数据浪潮的来临,和大数据的价值链。

所谓“大数据”

大数据的概念广为人知,但大数据是什么,尚没有一个权威的定义。目前,流传较广的是大数据的4V定义。 2001年,麦塔集团(META Group,现为高德纳)分析员道格·莱尼(Doug Laney)指出数据增长的挑战和机遇有三个方向:

1量(Volume),数据量大。从B(Byte)、KB、MB、GB到PB、EB、ZB等等,数据量的边界不断扩大。自人类有印刷术以来,过去上千年的印刷材料也只相当于200PB,而仅2011年一年,全球就新产生了约1.8ZB的数据。数据还在源源不断的产生,继续呈指数型的增长。

2速(Velocity),数据处理快。尤其是涉及到感知、传输、决策、控制开放式循环的大数据,对数据实时处理有着极高的要求。

3多变(Variety),多样性。数据来源广泛,既包括了数值型数据,也包括了文字、图形、图像、音频、视频、网络日志、邮件等非结构化数据。有统计显示,全世界结构化数据年增长率大概是32%,而非结构化数据则是63%。2012年,非结构化数据占有比例已经达到互联网整个数据量的75%以上。

以上三种特征合称“3V”或“3Vs”。而后,不同机构在此基础上定义了不同的第4个V,包括真实性(Veracity)、价值(Value)、活力(Vitality)等,在此不一一赘述。

在这里,笔者认为,大数据是指巨量的数据集,并且指通过专业化的工具来收集,处理,加工后能够形成具有商业价值的数据集,而具体处理数据的技术、包括硬件软件本身的商业价值则不在讨论范围之内。

大数据浪潮已至

自2010年起,各种关于大数据时代来临的呼声不断。2012瑞士达沃斯世界经济论坛的与会者宣称,数据的威力无比强大,数据是一种新的经济资产,就像货币和黄金一样;这不仅是一次技术革命,从某种意义上说是一种社会革命,将对国家治理模式、企业决策、组织和业务流程、个人生活方式产生巨大的影响。麦肯锡在2011年出具的报告中,也把大数据,作为下一步创新、提高生产力的核心竞争力。笔者认为,大数据时代的来临,与如下三点原因密不可分。

一、社会活动的可数据化。技术手段的扩展,尤其是互联网的发展,允许几乎所有存在物的痕迹都可以被实时记录,并可能公开暴露在网络之上。淘宝网站每天有超过数千万笔交易,单日数据产生量超过 50TB (1TB 等于 1000GB),存储量 40PB(1PB 等于 1000TB)。 百度公司目前数据总量接近 1000PB, 存储网页数量接近 1 万亿页, 每天大约要处理 60 亿次搜索请求,几十 PB 数据。互联网,特别是移动互联网的发展,加快了信息化向社会经济各方面、大众日常生活的渗透的同时,也使得人们社会活动的可数据化程度大大提高。

二、数据相关技术的进步。ICT及相关技术的大发展使庞大数据的产生、收集、存储、处理、应用成为可能,随着数据量级的飞跃,数据处理从关系型数据库,到数据仓库,再到“联机分析”、数据挖掘、数据可视化,在不断发展与演变的基础之上,大数据技术出现。为了从大数据中获取价值,新技术,例如存储,计算和分析软件,还包括了数据挖掘技术,也就是当前火热的机器学习和人工智能等。

三、相关政策的出台与完善。随着数据可得性的增强,监管部门越来越关注数据的获取和使用问题,世界主流国家均出台了包括但不限于隐私、安全、知识产权等等相关法案和条例。其中,隐私问题,尤其是消费者的个人资料,包括健康和财务数据等,随着大数据的发展,显得尤为突出。另一方面,数据的安全问题也值得注意。欧盟 (EU) 曾于 1995 年 10 月颁布的《欧盟数据保护指令》(EU Data Protection Directive,即 95/46/EC 号指令)为妥善处理个人信息提供了一个基本框架。目前,欧盟已开始着手起草《通用数据保护条例》(General Data Protection Regulation) 以取代该指令。这将使欧盟全体成员国能够遵守同一套原则,并在执行方面协调一致。美国针对不同的行业部门有具体的数据保护法规,如医疗卫生部门施行的《健康保险流通与责任法案》(Health Insurance Portability and Accountability Act,缩写 HIPAA)以及适用于需要与欧盟交换数据的出口部门的《美国-欧盟安全港架构协议》 (US-EU Safe Harbor Framework)。在个人隐私和网络安全频出问题的背景下,我国也相继出台了一些保护公民网络隐私权的法律法规与制度条文, 特别是于2017年6月1日正式实施的《中华人民共和国网络安全法》,强调了中国境内网络运营者对所收集到的个人信息所应承担的保护责任和违规处罚措施。

从数据可得和数据处理来看,大数据的浪潮已至。相关监管政策的出台也为大数据时代的数据隐私与安全保驾护航。然而,不得不说的是,随着收集和交换的数据量越来越大,法规可能还无法跟上新的时代。在这种情况下,针对数据保护和隐私的隐性规则显得尤为重要,APEC 和 OECD 曾发布了一系列关于数据方面的框架,包括了收集限制,使用限制等等,为提高效用和保护隐私的边界提供了一个可供参考的准则。

大数据价值链

一个商品从材料到最后到人们手中,会经历材料供应,成品开发,生产运行、成品储运、市场运营、和售后等多个环节,这被称为企业的生产经营环节,也是企业创造价值的一系列互不相同又相互关联的经济活动,也被称为产品的价值链。其中,大数据产业地图曾把大数据产业链分为收集、处理、分析、应用四个环节。

Source: CapGemini: http://www.capgemini.com/sites/default/files/technology-blog/files/2012/09/big-data-vendors.jpg

综合资料,笔者把从数据信息到数据产品的产生,并到最终的应用也分为了产生,收集、处理和应用四个环节。如下图。

而大数据的特殊性在于,信息本身是可分离的,这意味着,在这个价值链条的每一个环节,数据都能够直接变现。如在数据产生后,数据可以直接销售。最典型的Twitter,它拥有毋庸置疑的海量数据,但是它的数据都通过两个独立的公司授权给别人使用。收集环节同样如此,以数据集或开放API接口的方式销售。在处理环节,数据可以被做成数据产品来销售。在此情况下,数据在每个环节销售的形态,及附着在环节中的经济活动均有不同的形式,即,数据可能在收集环节后以数据集的形式销售,也可能在经历了全部环节后形成闭环指导数据的产生行为。

在下一篇中,笔者将阐述在数据价值链条中数据产生和采集过程中直接变现的商业模式,并结合相关案例,分析在这一环节中,数据资产的价值和经济活动以及数据安全等问题。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。