清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

文/北京百观科技有限公司CEO陈沐

(本文为“证券机构数字化转型与证券科技创新”征文活动入围文章。)

内森·梅耶·罗斯柴尔德是近代金融史上最具影响力的人物之一,也是罗斯柴尔德家族第一个走出欧洲大陆向全球发展的核心成员。在拿破仑战争时期,因为英军长期深入欧洲内陆腹地,军饷发放一直是一个老大难问题,而英军自身的系统又异常缓慢。罗斯柴尔德凭借其家族在欧洲庞大的、积累数十载的线人和情报网络,高效而快速地为英军提供了从国债融资、金币供应、当地货币兑换等一条龙服务,为英军的补给线提供了充分保障,帮助英国最终赢得了战争,而罗斯柴尔德也获得了巨额的收益,奠定了这个家族在19世纪世界金融历史上的霸主地位。罗斯柴尔德家族的这个情报网络如此高效,以至于一直有传言说,罗斯柴尔德因为提早三天知道滑铁卢大战的战果,通过高抛低吸获得了令人瞠目结舌的利润。

毋庸置疑的是,信息一直是资本市场的核心要素。而随着世界信息化水平,特别是21世纪以来,互联网化水平的指数级地提高,各种传统数据类型以外的新型数据应运而生,对资本市场的走向产生越来越深刻的影响。这些新型数据,有别于传统的政府公开数据、公司财报数据、行业研究报告、用户调查等信息类型,被行业统称为“另类数据”。

近年来,另类数据在投资研究领域的应用迅速拓展。根据IDC的报告,全球数据总量将从2018年的33ZB增长到2025年的175ZB。从市场空间上看,德勤预计到2020年全球另类数据采购金额将超过70亿美元。根据另类数据咨询公司EagleAlpha2018年报告介绍,全球现在有700多种数据源,400多家另类数据提供商,300多家机构在深度的使用另类数据。

Part 1:另类数据的发展和案例

另类数据的发展本质是信息市场新一阶段变革,了解信息市场和资本市场之间的关系有利于更全面的理解另类数据行业的发展。

金融市场的有效性取决于高效的、完全的信息传递。信息流通在投资者和融资者之间,撮合投资者和融资者相遇、合作、共赢。因此,通顺、有效、透明的市场信息环境,对信息不对称性的有效降低,是一个成熟资本市场的根本基础。信息的原料往往是数据,因此每次经济和技术的变革,带动着数据相关技术的革新,信息行业都将随之革新。数据信息行业与金融业的发展相息相伴,而现代信息行业,可大体分为三个阶段:标准化信息时代,数字化信息时代,大数据化信息时代。

19世纪末,电报技术在欧洲大陆开始兴起,逐渐代替了传统“飞鸽传书”的信息传输模式。1851年保罗·路透赶在伦敦证券交易所正式开通电报传输前,和伦交所签约锁定了其电报报价权,开启了路透社100多年的商业信息巨头之路,从路透发展出来的商业信息公司Refinitiv至今仍然是该行业的领头羊。20世纪末,个人电脑技术和互联网掀起了第三次工业革命,使批量传输数据和处理数据的能力变得唾手可得,IBM和苹果在80年代分别发布了个人PC和MACPC;同期间,彭博(Bloomberg)也推出了基于个人电脑技术和互联网技术的彭博终端,开启了数字化商业信息的时代。经过几十年的发展,商业信息行业涌现出彭博、CapitalIQ、FactSet,万得咨询等以个人终端和互联网传输为核心的信息服务大型厂商。

近年来,移动互联网、大数据技术、人工智能、云存储等技术日益成熟,借鉴历史发展,不难看出商业信息服务行业又迎来了一个新的时代。

Part 2:另类数据产品和服务的现状

另类数据在2010年左右开始在投资研究领域应用,也有一些广为流传的案例。虽然现在行业处于初始阶段,每个公司提供服务和产品的形态各异,但是主要价值体现可以归为两类,第一类是新数据源升级或者补充现有研究方式中的信息来源,第二类是应用新的大数据技术增加已有信息获取及处理的效率。

新的数据源作为新的信息来源,补充了现有的研究,这对使用者来说是比较直接的应用方式。在这种情况下,数据提供方会把原始数据加工成一些投资机构需要的指标,或者写成研究报告,投资机构的研究人员可以直接的把信息加入到他们的研究模型里面。对于研究员来说,这种使用方式的好处是在增加信息的同时,不需要从核心改变他们对于公司的研究框架。

在此类型的应用当中,比较典型的例子是卫星数据。由于美国是一个“车上国家”,消费者普遍驾车去消费场所(商场、酒店、餐馆等),因此消费场所通常配有非常大的室外开放停车场,停车场的车流量和场所的客流量有比较强的相关性。如果该场景是消费率较高、客单价稳定的场景,比如连锁快餐餐馆(麦当劳、肯德基等),那么停车场的车流量就可以准确的和公司的业绩挂钩。过去,研究人员获取该信息的方法是派人到场去数车,但是这种方式耗人耗时,且准确度有限,遇到门店特别多的连锁餐厅就非常难难以开展。在卫星数据出现后,研究人员可以通过图片识别技术,从卫星图片统计到标的上市公司所有门店每天的车流量。这种应用场景已经有成功的案例,比如图1中所展示的,美国卫星数据公司OrbitalInsights利用图像识别算法分析卫星图片,监测到的上市快餐公司Chipotle(CMG)的车流量指数(白色线)就和CMG股票的股价有非常高的相关性(橙色线)

类似的案例还有网页/app公开信息的收集和分析。过去,研究员要看某个消费公司在电商平台上面的销售额,需要通过电话咨询物流公司、供应商等了解该消费公司的销售情况,或者专门花时间在电商网页上定期计算每个商品的单价和销量后加总。如果该公司有不同品牌,并且在多个电商平台不同的店铺销售成千上百的商品,那么研究人员需要记录的可能是几万甚至几十万的数据点,这是一个无法完成的任务。而现在一些数据提供商可以通过自动化程序,把研究人员收集这些网页公开信息的流程自动化,定期在短时间内完成对于这些信息的收集。

在最近的几年,新技术的发展,如人工智能相关技术,也应用在投资机构处理数据和信息的实践当中。这些工具指数级地提升了研究人员原有的信息处理能力,一方面解放了研究人员的时间,使他们可以做更多更有价值的任务,另外一方面也使过去因为太过繁重而无法实现的分析变成可能。这些工具包括了财报自动化处理系统、自动化相关性调测系统、自动建模等。这其中最为著名的是在2018年被标准普尔收购的人工智能公司KENSHO。KENSHO尝试通过技术把许多与金融市场相关的事件转换为结构性的数据库,应用在投资研究工作中。

类似Kensho这一类型的产品把分析师的一些数据采集、整理、组织的过程自动化。过去分析师做上图的分析,需要收集各种历史数据,耗时长而且容易出现人为处理上的误差。Kensho的出现使非机构化数据变得更好吸收。这种应用从广义的角度来看,也是“另类数据”的一种。

Part 3:机构应用数据的方式和组织架构

随着早期探索的成功,投资机构开始重视在投资流程中应用新型数据和大数据技术。对冲基金引领行了业应用新型数据和大数据技术,私募基金和资产管理公司也随之跟进。但是这个过程不是一蹴而就的。面对新的技术,传统机构的组织架构和工作流程需要调整适应,这个过程中,机构会遇到各种问题,包括如何把握资源的投入、如何判断应用的效果、如何有效的使用数据、如何搭建内部团队、如何与外部提供商合作。最早开始数据应用探索的机构,已经经历了多次组织架构的迭代。针对这些问题,现在投资机构主要采用以下几种方式进行新数据和技术的探索:直接采用外部数据、在投资团队内配置数据研究能力、机构层面配置数据团队、完全内化的全链条数据团队。

直接采购的使用门槛最低,也是很多投资机构“上手”另类数据的普遍方式。基金的研究团队会通过不同渠道去寻找市场中的数据产品,许多产品以研究员熟悉的研究报告和EXCEL的形态交付。研究员从报告里面找到自己想要的信息,融合到自己的研究框架中。这种方式的优势是学习成本低、上手快,并且基于新数据的研究报告能够作为传统调研的一种补充。但是因为报告/Excel内容高度标准化,使用信息做研究的基金数量较多,可能会稀释基金投资决策的独特性。此外,报告通常以静态模式呈现,如果研究员有更多的问题或者需要其他角度的信息,获取成本会比较高,大多时候可能无法获取。

在直接采购的基础上,有的投资团队开始配置数据分析力量,一种是对现有的研究人员进行数据技能的培训,比如学习Python、MySQL等大数据处理课程,另一种方式是直接招聘数据研究员。处理大数据的能力赋予投资机构对数据深度的认知,可以更好的把数据融合到研究过程里面。同时,投资机构也可以对供应商提个性化需求。

很多机构都会优先考虑这种路线,但是实现起来困难重重。其中最大的困难是人才的培养和招聘。原有的研究人员如果不是工科或者理科出身,学习大数据语言比较困难。如果选择直接招聘,机构原来的团队往往对数据、技术方面的人才市场不熟悉,并且市场上既懂数据又懂投资研究的人才比较稀缺的,在招聘上面会遇到困难,从而导致数据能力的配置进展受阻。

找到合适的人来启动是关键的一步。考虑到上述找人耗时耗力等原因,规模大的机构(资产管理规模达到10亿美元以上)可能会选择投入资源和时间在管理层引进一个负责人,比如CTO或者CDO,由这位负责人搭建团队和调整架构。虽然管理层可能比一个普通的数据研究员难找,但是一旦找到一个合适的人,机构应用数据的进展会顺利很多。这种尝试比较成功的是美国的Coatue基金及加拿大养老基金,这两家基金中有20-30%的员工是数据和技术人才。

Part 4:产业链的格局

产业链的另外一端是基于新数据和新技术而发展的服务商。投资机构和企业对于数据的需求增长带动了服务商的成长。从不同口径统计,现在全球有400-700家为投资机构提供数据相关服务的公司,包括不同形态的产品和服务提供方,涵盖投行研究团队、市场咨询公司、数据中台系统、数据中介、另类数据公司、传统信息巨头等。

最早提供数据服务的主要是传统的研究机构,包括投行的研究部门如摩根斯坦利(MorganStanley)的AlphaWise,瑞银(UBS)的EvidenceLab及独立研究公司如PacificEpoch,MScience等。这些公司主要业务是提供研究报告和服务给投资机构,核心是基于传统的调研(渠道访谈、实地调研、高管访问、用户问卷访谈、桌面调研等),整合成研究报告。长期以来,这些机构始终通过各类渠道收集信息来支持它们的研究,而另类数据作为一种信息收集渠道,也顺理成章的成为了研究机构的调研手段之一。

这些研究机构成立的时间比较早,通过传统的研究方法覆盖了许多市场标的,将新增的数据内容补充进原有的研究报告后,传统研究机构所提供的研究成果能够更好的满足投资市场的需求。

在过去几年中,数据一直在企业运营层面扮演着重要的角色,特别是针对于互联网企业,一些机构将其作为客户,为其提供数据服务和数据产品,这些机构包括AppAnnie,TalkingData,SecondMeasure,QuestMobile等。他们所提供的数据产品此前主要应用于企业运营、营销、广告投放等方面的分析,在投资机构开始使用另类数据之后,这些机构也开始面向投资机构提供数据产品。成立于2011年的AppAnnie是这类机构中比较成功的一家。该公司成立初期主要为App开发商提供App的数据收集和分析,后来开始将客户范围拓展到风险投资机构和对冲基金。投资机构意识到使用AppAnnie的数据可以分析市场上大量的App产品,于是开始用AppAnnie的产品来回答诸如“哪个类型的App在最近的一个季度发展最快”、“Instagram在亚洲的用户增长和收入如何”、“最近某个游戏用户增长不错,驱动的原因是什么”等问题。2016年,AppAnnie年收入超过了1亿美元,其中一大部分是来自投资机构的收入。

另外一类提供商是另类数据产品公司。有别于服务企业的数据公司,另类数据产品公司成立初期就以投资机构作为其主要的服务对象。他们的业务模式是基于一个或者多个的数据源,通过自有的研发团队开发算法,将大量的原始数据加工成可以提供给投资机构便捷使用的数据。这些公司的兴起有赖于企业生产和经济运行过程大数据(ExhaustData)的积累,而这些公司可以通过采购或者公开收集的方式获取数据,再加工成为投资机构可用的维度和指标。目前已经被成功产品化的exhaustdata包括地理位置信息数据(GeolocationData),社交媒体数据(SocialMediaData),非上市公司数据(PrivateCompanyData),网络公开数据(PubliclyAvailableWeb/AppData),天气数据(WeatherData),卫星数据(SatelliteData),App运营数据(AppUsageData),网络流量数据(WebTrafficData),银行卡数据(CreditCardTransactionData)等。前文提到的OrbitalInsights便是这类机构中的翘楚,这个于2013年成立的公司,在过去6年间获得了红杉、谷歌、彭博、Balyasny资管公司和芝加哥期货交易所等知名投资机构的投资,并与彭博、加拿大皇家银行等机构开展了合作。

数据源的增多意味着投资机构需要和越来越多的服务商沟通,对接不同结构不同格式的数据,无论多大的投资机构,面对几百个数据源都会应接不暇。根据报道,著名对冲基金Point72一年中接触了1200家数据服务商,最终采用的只有30-40家。如果数据团队将大部分时间都花在采购上面,花在数据挖掘上的时间就会相应的受到压缩。数据整合公司也就应运而生。数据整合公司主要分为两类,一类是为投资机构搭建数据中台,以技术的模式,比较标准的面对数据源对接模式,这其中比较出名的是由前路透社高管PhilipBrittan成立的CruxInformatics。Crux成立于2017年,短短的2年期间,它已经获得了高盛、花旗银行、2Sigma等著名金融机构的投资。另外一类是数据中介/市场服务,这种公司主要是通过在上游数据源或者下游投资机构中所构建的庞大网络,撬动产业链的另外一头,其所专注的是数据提供方和数据使用者的撮合,同时选择性的提供一些技术加工服务,这些公司包括Quandl、EagleAlpha等。

国内外传统的金融咨询平台,如彭博、FactSet和万得也看到了另类数据对于其用户的价值,并在传统的产品上添加了另类数据的模块。彭博和FactSet提供的是一个开放的另类数据市场,彭博在企业服务业务(BEAP)中加入了另类数据平台,而FactSet是添加了Open:FactSet的数据开放平台,通过这两个界面,用户可以对接几十种不同的数据源。而万得采用的方法是把另类数据,如电商数据和ESG数据整合到其现有的客户端产品中。

Part 5:另类数据行业对金融市场的意义

在国际市场上,无论是投资机构对另类数据的使用,还是各类数据相关的服务商,都在不断深化和发展。资本市场中成功的投资团队必须要对市场熟悉,具备良好的市场定位能力,还要有融资决策、成本控制以及定价策略等各方面的综合能力。在各行各业信息爆炸的形势下,要在资本市场保证领先优势,必须掌握及时、全面、定期和高质量的对于宏观、行业、资本市场以及个股的分析报告和其他丰富的信息服务。我们看到,国外的投资机构巨头正在积极的投入到新数据和新技术的应用当中。当前市场处在早期摸索的阶段,另类数据行业可以帮助国内投资机构站在新一代金融信息产业发展的战略制高点,赋能国内投资机构综合研究能力,帮助中国投资机构达到世界顶级水平。

与此同时,另类数据的发展也会助力资本市场的建设。信息公开是资本市场的基石,一个不公开透明的资本市场,定价一定是扭曲的,资源配置也是不合理的,因此难以形成相对公允的价值去反映公司的经营情况,也就为各类资本操纵市场提供机会。公司造假、操纵股价和内幕交易等行为,是对资本市场根基的腐蚀,对建立长期健康的资本市场有极大的损害。另类数据行业通过公开透明的数据信息产品,使更多投资者理解公司价值,有效预防各种通过信息不对称进行市场操纵的行为,切实维护中小投资人利益,维护市场长期发展的根基。

证券市场上,信息披露是上市公司的义务,知情权是投资者的基本权利。全球成熟市场的投资者极为关注健全的信息披露制度。只要市场的透明度不断提升,中国的证券市场就是一个有生命力、有活力的市场,可以建立全球投资者的信心,吸引全球投资者的参与,从而进一步激发资本市场的生命力,共同推动证券市场的朝着更为健康的方向发展。通过大大降低信息不对称,另类数据行业可以大幅提高资本市场信息披露的质量,为中国金融对外开放、与全球资本深度融合提供长期技术支持,提高中国机构在国际资本市场的话语权,实现弯道超车。

总结

在西方资本市场几个世纪的发展历史中,诞生了一批估值数百亿美金,掌握资本市场资讯话语权的巨型金融数据公司,包括彭博、路透、标准普尔、FactSet、穆迪、MSCI等等。而长期以来,中国虽然整体经济实力已经达到世界第二、即将成为世界第一的水平,但是资本市场的发展阶段还较为初期,在国际资本市场的影响力也还不能与中国经济实力相匹配。具体体现在金融信息方面,即中国尚未出现一家对资本市场有足够话语权、掷地有声的数据资讯公司及平台。但是笔者相信,随着中国经济整体实力的进一步提高,我国在全球资本市场的地位也会进一步提升,我们也必然需要有在全球资本市场掌握话语权的顶级资讯企业及平台。在这个方向上,国际市场的探索仅仅领先中国市场几年,反观近年来中国另类数据的发展在迅速加快,使用新型技术颠覆传统商业模式的平台,最有机会实现弯道超车。中国的另类数据行业通过最前沿的数据分析技术,有志向也有能力诞生出一家在国际上拥有影响力、话语权、行业公信力的中国金融数据平台,为国家掌握全球资本市场制高点。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


发表评论
您的评论提交后会进行审核,审核通过的留言会展示在上方留言区域,请耐心等待。
猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。