清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

机器人选股风头正盛,华丽宣传背后究竟有多智能?通过对多因子数据分析筛选出的股票是否靠谱?机器人选股未来会取代人工吗?解码新金融,为您解读。

张家林:“中国的市场信息结构动态变化比较快,有的时候信息公开,它非常接近一个透明的箱子;有的时候非常接近黑箱子,搞不清楚发生了什么,突然第二天就跌停,这个现象本质说明,国内市场信息的结构在动态变化。”只要识别出信息结构来做后续工作,并不是说美国的市场一定有效,中国的市场一定无效,这完全是两回事。”

机器人选股在美国市场一路攻城略地,风头无俩,打动了国内市场蠢蠢欲动的心。铺天盖地宣传推广背后,机器人选股到底有多智能,能否在国内土壤上结出丰硕果实,引发业界不同观点。

王丽颖:“以公募的量化投资来讲,所有的模型都逃脱不了核心因子的择时问题以及在市场的反馈问题,这是决定投资非常重要的两个因素,而这两个因素是机器选股根本解决不了的问题。”

本期嘉宾

张家林: 金融四十人论坛常务理事

王丽颖: 东方证券首席财富顾问

以下为文字实录

机器人如何选股?

“选股多是重复性的工作,利用机器人自动化技术,按照选股的基本技术,用人工方式做出模型和模式,就是机器人选股的基本原理。”从一开始,张家林对人工选股技术进行分析,深入浅出介绍出机器人选股的原理。人工选股是通过对宏观经济、行业、个股进行分析,最终选出适合当前或者今后一定阶段能够投资的个股。从基本技术上,机器人选股来源于最初的证券投资分析最前沿部分。

“机器人选股则更多是抓取主要因子”是王丽颖重要观点。

在她看来,人工选股进行判断和标地的选择时,其方法分为技术面和基本面。基本面指PEPBLE等基础数值,技术面包括金叉、死叉、MACD,黄金分割位等技术指标。这些数据原来是人的主观判断,机器人选股则更多是抓取主要因子,对投资标地进行整体筛选。

“主要因子有多种,例如资金驱动型,以资金的流入流出为主;像传统的筹码分布,主力筹码集中度高不高也是选股逻辑;又如,数据的偏离度、背离度、乖离率等技术指标,都作为筛选的因子。目前最流行的是α策略或多因子策略,它把这些因子综合起来,设一个权重,根据市场的时点选取不同因子的权重,形成综合选股体系。这种方式对于整个市场的波动影响会小一点,对整个市场的趋势趋同性更好一点。”

大数据时代,个股的变化已经远远地超过以前认知的多因子。张家林认为,以前用多因子模型进行分析,现在由于大数据支撑,用的是机器学习。多因子不超过40个指标,包括技术指标、量化指标、宏观经济指标等,但是现在个股更丰富,包括产品、服务、社交关系等外部数据关联。

“这样的数据非常大,以前在证券投资公司一般做Excel表格,就能做出简单的投资分析。大数据时代,简单工具化处理已经不行,必须要用机器的手段来做,这就是机器学习。”

机器人选股趋同性隐患 易引发羊群效应

然而,当大量的股民用机器人选股,就会引起趋同问题,这是目前机器人选股面临的困惑。

“目前国内股民大概一亿多,股票逾3000只,如果每个股民都用一个机器人来选股,就会出现一个很大的问题——趋同性。因为如果所有的机器人选股系统都很聪明,它们选出的个股应该是一致的,最后推荐给一亿多股民,所有人都去买,就会产生趋同交易”,张家林分析称,股民买的股票都一样,会增加羊群效应,羊群效应带给市场最大问题就是波动性增大,产生千股跌停千股涨停的现象。

通过《新闻联播》去判断将来哪个板块会热,捕捉相关新闻和股票板块的联动,这是国内股民的必须课程,张家林称,这却让机器人选股遇了难。

“新闻事件传导到个股的价格变化过程是非常复杂的,可以认为是黑箱子,导致结果难以预测。传导机制太复杂,机器学习分析不了,导致的必然结果是单一的信息源,最后产生的结果,一般的概率精确度不超过60%。”

王丽颖对机器人选股的忧虑不仅限于此。

大数据确实有很多优点,比如有软件推出舆情的监测,通过监测股民情绪,对整个市场的趋势进行一个短期研判,有一定的理论基础。但是,股票投资属于对未来的事件研判,机器人通过这种大数据选股,仍有很多信息很难截取。譬如当前大热的雄安新区、粤港澳题材,这种数据是无法截取的。哪怕创造历史的数据,这个概念是有扩展性的,无论机器有多智能,也无法进行全面有效覆盖。

机器人选股在国内市场水土不服?

机器人选股在美国市场上一路攻城掠地,但在特色化的国内证券市场能否有所建树,双方观点不尽相同。

王丽颖持否定态度,“在A股市场,加入再多的量化指标、智能因素,甚至是对未来产生某种有作用的一些因子,通过机器人分析消化,反馈出来的数据跟市场也可能会产生比较大的偏差。”以公募的量化投资来讲,所有的模型都逃脱不了核心因子的择时问题以及在市场的反馈问题,这是决定投资非常重要的两个因素,而这两个因素是机器选股根本解决不了的问题。“所以,我们更多的是通过机器进行数据的筛选,然后人工来进行择时。”

张家林则是肯定观点持方,在他看来,机器人选股在中国水土不服这个观点并不正确。

“无论是机器人选股还是人工选股,非常重要的因素是市场的信息结构。美国市场和中国市场,不同的是市场的信息结构。而信息结构是由证监会的制度、中国的文化和特定的投资人产生。只要识别出信息结构,基于此来做后续的工作,所以并不是说在美国市场一定有效,在中国市场一定无效、不能用这些技术,这完全是两回事。

在美国,描述市场的信息结构两个极端,叫EMH有效市场,发达国家的市场接近EMH有效,特别不发达的国家接近于拍卖市场或简单市场信息。一点信息都没有的是黑箱子,有效市场可以认为是个透明的箱子,而中国市场的结构非常复杂,处于在两个市场的中间地带。中国的市场信息结构动态变化比较快,有时,它非常接近一个透明的箱子,信息非常公开;有时非常接近黑箱子,搞不清楚发生了什么事情,突然第二天就跌停,这个现象本质说明国内市场信息的结构在动态变化。

因此,不管是机器人还是人工智能,如果将来能够迅速地捕捉这种变化,对于将来的分析是非常有益的。国内市场结构是由很多因素来决定的,目前来讲还比较难改变,作为投资者来应该去善于发现,或者利用一些技术,来精准地识别信息结构的改变。

A股突发波动或与机器人选股有关

进入2015年,股灾成为经常被提起的字眼。据王丽颖观察,A股市场很多莫名其妙的突发波动,其实跟机器人选股有很大的关系。尤其表现在个股的急涨急跌,深层次追究,有可能与数据的筛选有一些关联。

机器选股将会对市场造成人为的影响,这样的影响对于市场未来的发展到底有多大尚未清楚,介入监管就变得十分迫切。“什么样的用户适用机器人选股,用户数量达到多少,用户资金量是什么规模,都需要有效统计并监管。监管部门应该建立一套监控监督系统,随时截取数据,通过数据分析对于市场的人为影响”,王丽颖说道。

机器人选股前景美好又艰难

机器人选股本土化美好可期,同时也曲折漫长,尤其是近期的发展或将非常艰难。

首先,量化投资的精确与传统人工选股的“少许”态度截然相反。人工选股就像做中餐,可以盐少许,油少许,但在做量化投资的时候,机器人不可能理解少许的含义,一定要给它确定的代码和含义,才能够实现操作。

市场投资标地的土壤不同,很难开出相同效果的花。王丽颖对此表示,“在西方,除了市场大的环境因素,更多的应用机器人筛选的是ETF的产品,这部分参与量化投资的投资者,期望的是长期稳定的收益。而在国内的选股逻辑,希望在个股筛选出一个远远超过市场平均涨幅,最好是每天都会涨停标地,或者每天都上涨。国内市场的适用人群预期完全不同于国外,因此,把机器人选股带到国内市场中,适应的过程就很漫长。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。