品品科技|迎来TCN!股市预测任务是时候拥抱新技术了,告别RNN( 二 )


Hongyan等人在论文《TemporalConvolutionalAttention-basedNetworkForSequenceModeling》中提出一种探索性网络结构:基于时间卷积注意力的网络(TCAN) 。 该网络结合了时间卷积网络和注意力机制 , 包括两个部分:一个是时间注意力(TA) , 用来捕获序列中的相关特征;另一个是增强残差(ER) , 用来提取浅层的重要信息并迁移到深层 。
以上时间线旨在方便读者了解FTS与深度学习的历史关联 , 并非淡化同时期学术界其他人所做的重要工作 。
需要注意的是:FTS预测领域的学术出版物可能具有误导性 。 由于大量使用模拟器 , 许多FTS预测论文往往会夸大其性能 。 这些论文中声称的许多性能难以复现 , 因为它们无法泛化至所预测的特定FTS的未来变化 。
2.FTS数据预处理实践
2.1去噪
金融时间序列数据(尤其是股票价格)会随着季节、噪声和自动校正而不断波动 。 传统的预测方法使用移动平均和差分来减少预测的噪声 。 然而 , FTS通常是不稳定的 , 并且有用信号和噪声之间存在重叠 , 这使得传统的去噪方法无效 。
小波分析在图像和信号处理等领域取得了令人瞩目的成就 。 它能够弥补傅里叶分析的缺点 , 因此被逐渐引入经济和金融领域 。 小波变换在解决传统时间序列分析问题方面具有独特优势 , 因为它可以分解和重构来自不同时域和频域范围的金融时间序列数据 。
小波变换本质上利用多尺度特征对数据集进行去噪 , 从而将有用信号与噪声高效地分离开来 。 JiayuQiu等人将coif3小波函数用于三个分解层 , 并通过信噪比(SNR)和均方根误差(RMSE)来评估小波变换的效果 。 SNR越高 , RMSE越小 , 小波变换的去噪效果越好:
来源:https://journals.plos.org/plosone/article/file?id=10.1371/journal.pone.0227222&type=printable
2.2数据shuffle
在FTS中 , 选择哪些数据作为验证集并非易事 。 确实 , 验证集的选择有无数种方法 , 但对于变化不定的股票指数 , 必须仔细考虑 。
固定原点方法是最朴素也最常用的方法 。 给出特定的分割大小 , 将数据前面一部分分割为训练集 , 后面的部分分割为验证集 。 但这是一种较为初级的选择方法 , 对于像亚马逊这样的高增长股票而言尤其如此 。 之所以会出现这种情况 , 是因为亚马逊的股价一开始波动性较低 , 随着股价的增长 , 股价波动越来越大 。
品品科技|迎来TCN!股市预测任务是时候拥抱新技术了,告别RNN
文章图片
亚马逊今年股票价格(图源:GoogleFinance)
因此 , 我们需要训练一个低波动率动态模型 , 并期望它能预测高波动率动态 。 对于上述类型的股票而言 , 这确实有一定困难 , 并且还要以性能作为代价 。 因此 , 如果仅考虑这一点 , 以验证损失和性能作为基准可能存在一定的误导性 。 但是 , 对于像英特尔这样波动性较为稳定的股票(COVID危机前) , 这种方法是合理的 。
滚动原点重校方法比固定原点方法略稳健 , 因为它允许通过对数据的多种不同分割取平均值来计算验证损失 , 以避免无法代表高波动率时间段的问题 。
最后 , 滚动窗口方法通常是最有用的方法之一 , 因为它尤其适用于长时间运行的FTS算法 。 实际上 , 该模型输出多个滚动数据窗口的平均验证误差 。 而这意味着最终获得的值更能代表最近的模型性能 。
品品科技|迎来TCN!股市预测任务是时候拥抱新技术了,告别RNN
文章图片
数据shuffle技术可视化(图源:https://arxiv.org/abs/1812.07699)
ThomasHollis等人的研究表明 , 滚动窗口(RW)和滚动原点重校(ROR)的性能(58%和60%)都比简单的固定原点方法好 。 这表明对于像亚马逊这样的高波动率股票 , 使用这些数据shuffle方法是不可避免的 。


推荐阅读