当前位置:首页 > 天道酬勤 > 正文内容

()

张世龙2021年12月21日 04:39天道酬勤590

在今天我们发表的这篇文章中,作者Sonam Srivastava介绍了金融中三种深度学习使用情况以及这些模式优劣的证据。

我们按照Sonam Srivastava的分析,展望了深度学习在金融领域的应用前景。 金融是计算密集型最多的领域,但广泛使用的金融模型:监管和无监管模型、基于状态的模型、计量经济学模型甚至随机模型都受到过度拟合和启发式问题的影响,采样结果较差。 因为金融生态系统非常复杂,其非线性充斥着许多相互影响的因素。

为了解决这个问题,考虑深度学习对图像识别、语音识别或情感分析进行的研究,这些模型可以从大规模的未标记数据中学习,形成非线性关系的递归结构,并可以轻松地调整以避免过度拟合

如果金融生态圈能够利用这些网络建模,应用领域将会深入和广泛。 这些模型可以用于定价、投资组合构建、风险管理、甚至高频交易等领域。 解决这些问题吧。

收益预测

以预测每日黄金价格的抽样问题为例,我们先来看看传统方法。

ARIMA 模型

ARIMA模型(Autore GRES ive Integrate DMoving Average Model )、差分综合移动平均自回归模型、或综合移动平均自回归模型(移动也称为滑动)、时间序列预测分析方法之一。 在ARIMA(p,d,q )中,AR为"自回归",p为自回归项数; MA为“滑动平均”,q为滑动平均项数,d为形成平滑系列的差分次数(次数)。 “差分”一词在ARIMA的英语名称中没有出现,但是是重要的一步。

ARIMA模型的基本思路是,将预测对象随时间推移形成的数据序列视为随机序列,并利用一定的数学模型近似描述该序列。 一旦识别出该模型,就可以根据时间序列的过去值和现在值预测未来值。 现代统计方法、计量经济模型在一定程度上可以帮助企业预测未来了。 如果整合移动平均自回归模型,试图预测季节稳定的时间序列,则会得到如下图所示的结果。

VAR 模型

VAR模型,(Vector Autoregression model )向量自回归模型是常用的计量经济模型,由计量经济学家和宏观经济学家Christopher Sims提出。 因为扩展只能使用一个变量的自回归模型(简称AR模型),容纳一个以上的变量,所以经常用于多变量时间序列模型的分析。

将相关的预测变量添加到自回归模型中,然后移动到向量自回归模型中,结果如下图所示。

如果对

深度回归模型

数据使用简单的深度回归模型,并使用相同的输入,则会得到更好的结果,如下图所示。

卷积神经网络

卷积神经网络(Convolutional Neural Network,CNN ) )是前馈神经网络,人工神经元可以响应部分覆盖范围内的外围单元,用于大型图像处理,

卷积神经网络由一个或多个卷积层和对应于经典神经网络的尖端全连通层组成,还包括相关权重和池化层(pooling layer )。 通过这种结构,卷积神经网络可以利用输入数据的二维结构。 与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能产生更好的结果。 这个模型也可以使用反向传播算法进行训练。 与其他深度、前馈神经网络相比,卷积神经网络需要考虑的参数较少,成为了具有吸引力的深度学习结构。

修改我的架构,使用卷积神经网络解决同样的问题,得到的结果如下图所示。

得到的结果得到了很大的改善。 但是,最好的结果还在后头。

长短期记忆网络

长短期记忆网络(Long Short-Term Memory,LSTM )是时间递归型神经网络) RNN ),论文首次于1997年发表。 由于其独特的设计结构,LSTM适用于时间序列间隔和延迟非常长的重要事件的处理和预测。

LTM的表示通常优于时间递归神经网络和隐马尔可夫模型(HMM ),例如用于不连续手写识别。 2009年,用LSTM构建的人工神经网络模型在ICDAR手写识别大赛中获胜。 LTM在自主语音识别中也普遍使用,于2013年被运用

TIMIT 自然演讲数据库达成 17.7% 错误率的纪录。作为非线性模型,LSTM 可作为复杂的非线性单元用于构造更大型深度神经网络。

使用循环神经网络(RNN)的变种后,我得到结果如下所示:

因此,整体来说均方误差的趋势出乎意料。

投资组合构建

我们尝试使用深度学习解决的第二个金融问题是投资组合构建。在这个问题上,深度学习的实际应用效果很好。我的研究灵感来自这篇论文:《深度投资组合》(https://0x9.me/8uOBt)

这篇论文的作者尝试构建自动编码器,将时间序列映射到自身。使用这些自动编码器的预测误差成为股票测试版(与市场相关)的代用指标,自动编码器用作市场的模型。

自动编码器(auto-encoder),是一种无监督的学习算法,主要用于数据的降维或者特征的抽取,在深度学习中,自动编码器可用于在训练阶段开始前,确定权重矩阵 W 的初始值。基于上述自动编码器的误差选择不同的股票,我们可以使用另一个深度神经网络来构建深度指标,结果相当不错,如下图所示:

深度神经网络已成为利用股票复制指数的指数构建方法。

但这只是它的开始!如果我们应用智能索引,在我去掉指数的极端下降期,并在智能索引上训练我的指数映射深度神经网络时,我就能以惊人的速度超过指数!

这种技术在证券投资组合领域有着巨大的潜力!

结论

目前金融业的趋势是朝更复杂、更健全的的模式发展。随着大量数据科学家涌入该行业,对所有银行来说,技术是一个巨大的压力。像 RelTec、Worldquant 这样的对冲基金,在其交易中已经使用这种技术。由于这些复杂模型在其他领域所表现出的优异结果,以及在金融建模领域的巨大差距,将会有一系列的戏剧性的创新涌现!

更好地解决金融和贸易领域的关键问题,将会提高效率、提高透明度、加强风险管理和新的创新。

译者感言:

深度学习的一大优势在于可以大幅减少人工参与的特征工程去“拟合”训练数据,但这也不是说完全不需要人去参与特征的选取,尤其是金融市场,数据简直是海量,并且大都高噪声,非稳定,所以除非你能够清楚哪些数据具有潜在价值、如何做适当的预处理和如何转化并达成哪些目标,否则深度学习在金融领域是无法应用的。

如果设计得当,增加神经网络的深度可以对更复杂的模式进行映射,因此可对金融数据的训练产生更好效果。

例如 CNN 适合处理图像一类的大数据,不一定直接适用于金融数据。金融数据虽然也可以很大,但通常不在一个数量级上——一幅图像中的样本数(像素、颜色)很容易上百万,要训练一个模型又要用到成千上万个图像,为了找到高效办法提取特征,于是计算机科学家想出了卷积神经网络通过抽取特征值来简化运算复杂度。而我们处理的金融时间序列数据,单组样本的数量常在百万以下,规模上往往不需要卷积。进一步比较,相对于金融数据,图像识别的特点是数据量庞大、特征明显、特征重复次数多、特征组合性强、出现的次序性、特征呈现的方向性有时不强,这与金融数据噪音大、数量较小的特点有所不同。因此,在训练金融数据时很有必要设计有针对性的深度机器学习模型。

本文涉及到的代码可在作者的 GitHub Repo 中找到 https://0x9.me/P5ahd

原文作者:Sonam Srivastava

译者:sambodhi ,编辑: 幸福的抽屉

扫描二维码推送至手机访问。

版权声明:本文由花开半夏のブログ发布,如需转载请注明出处。

本文链接:https://www.zhangshilong.cn/work/26091.html

分享给朋友:

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。