清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

12月5日,2017世界互联网大会“互联网与金融”分论坛在乌镇成功举办。哈佛大学统计学系终身教授刘军发表主旨演讲。刘军分享了统计学在人工智能和大数据中的作用,他认为用数据、网络进行金融方面的活动,是一个必然的趋势。概率统计模型可以在海量的数据里面找到一些微弱的信号,将传统的风险预测方法总结成一个多层次、多方位和系统性方法再进一步发展,进行多种预测。

哈佛大学统计学系终身教授刘军

以下为演讲全文:

非常高兴,也非常荣幸有这个机会来参加盛会。我是第一次来乌镇,非常美丽的城市,第一次来参加这么大的分会,也非常热烈地气氛,尤其是第一天听到习总书记,还有中央关于新时代发展行动纲领里面的,对于大数据和人工智能的定位非常地激动,我觉得我是搞数据的,我是统计学家,搞了一辈子数据,所以今天听到数据得到一个非常中心的位置感到非常鼓舞。这个东西正好从历史上到现在都是以数据为基础的,或者说学科,从大家来讲可能是一种商业模式。所以这里面我就分享一点关于统计学在这里面的作用和统计学在整个人工智能和大数据里面的作用。

我在两年前就说统计学一直是大数据的灵魂,我认为也是人工智能的几大支柱之一,大家都谈到过关于现代人工智能的发展,是为什么最近有一个突飞猛进?其中提到很多关键点,我觉得人工智能作为学问来讲,对于统计和概率、思维和方法的全面的接受和拥抱,是它发展一个非常重要的原因。前面的一些内容,我发现刚才刘社长还有很多领导已经提到了,关于互联网和大数据对于整个金融界的影响非常地巨大,我就不去细讲。

这里面有宏观,对内风险管理的影响也是非常地显著,其中我就强调一点,就是说现在大家更加关注用大数据、数据挖掘等等,来进行风险管理。刚才彭总也提到了蚂蚁金服做的东西,他们里面很多都再用数据的东西,进一步去促进这种方向的预测。另外,关于不变性刚才几位领导也都提到了,我们就不去多说。其实,从我自己的经验和以前听到的例子来讲,大数据或者是数据方法在金融界的应用一直是历史悠久,其中我是比较熟悉的两个公司,一个是美国文艺复兴科技公司,一个是美国TWO—Sigma公司,有很多的经验,都是再做量化的投资方面。

在这里面,大家可以说是一个传统的统计学的方法和计算机科学的方法,现在的人工智能尤其是深度学习的刚才也是刚刚进入这些公司里,还是在起一个比较小的作用,我觉得现在是一个非常好的发展阶段,至于新的浪潮对它整个的创新、影响,到底达到什么程度,我们觉得还是拭目以待。当然我觉得这是一种趋势,就是用数据、网络进行金融方面的活动,是一个必然的趋势。

这里面用概率统计模型一个重要的原因是因为我们在海量的数据里面找一些微弱的信号,这些信号可以用一些概率的语言来描述,小概率事件,很多人工智能的事情其实就是模式识别。噪音是大家一直没有提到的问题,实际上大数据的本质就是大量的噪音,怎么在大量的噪音里面找到真正的信号,这是统计学真正研究的任务,也是我觉得人工智能作为一个最后一个产品来讲,是软件中的软件,就是这种概率统计的方法。

这里面提几个风险预测基本的方法,就是有特征检查、选择损失函数、正规化及优化算法,这里面大数据的挑战,我总结成一个多层次、多方位和系统性方法再进一步发展,这是在以前的传统基础上进一步需要的一点,就是怎么样来用这种多方位的方法来预测。比如说预测整个社会对金融系统的健康性,这里面其实谷歌在以前做过一些很好的方法,比如说预测流感等等,利用现在的网络方面的个体化的信息,来做一定的修正,这是我认为比较有前景的挑战和方法。这里面统计学的问题,因为时间的关系我就列了几条,对怎么选取变量,怎么去做机器学习的模型建设等等,因为印象中好像深度学习就是把数据往模型里一扔就出来了,但是里面怎么弄好有很多的关系。

因为时间关系,我最后再讲一下几个大市场崩盘的情况,你们可以看出来实际上有一定的预测性,开始有一个非常高的升值,就迅速地下降。像这种的情况,能不能预测?怎么预测?也是我们研究的重点之一。实际上有一些可预测性,但是一个特点就是发生的事件非常地少,现在直接套用还是非常困难,但是发现一些更巧妙模型的基础上,对这个做预测,还是非常有前景。尤其用多方位、全面市场的健康诊断的方式来预测,是更有一些前景,我就讲到这儿,谢谢大家。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。