文/李伟能 黄树花
股票市场是金融业和证券业中不可或缺的重要组成部分,特别是在金融业日益发达的今天。为了更全面地反映创业板市场情况,向投资者提供更多的可交易的指数产品和金融衍生工具的标的物,推进指数基金产品以及丰富证券市场产品品种,深圳证券交易所于2010年6 月1 日起正式编制和发布创业板指数,自从创业板开市以来,一直是投资者的热选板块。
1 模型理论
1.1 支持向量回归(SVR)原理
支持向量回归的思想是通过非线性映射将输入数据映射到高维空间进行线性回归。主要有两种支持向量回归方法,分别是ε-SVR和v-SVR,下面主要介绍ε-SVR。考虑如下数据集:
X={(x1,y1),(x2,y2), …(xi,yi)},其中xi ∈ Rn 是输入向量,y ∈ R 是输出值, l 是样本数量,假设这些样本数据是相互独立的,且服从某种分布P(x,y),那么数据回归的目标就是找到一个函数使得期望风险最小化:(1)其中c(x,y,f)为基于数据集 的损失函数。由于并不知道分布函数P(x,y),所以只能根据估计函数代替积分,这就是所谓的经验风险函数:(2)由于经验风险最小化很容易造成过度拟合和过度学习,于是提出了ε 不敏感的损失函数:(3)则ε-SVR 转化为如下优化问题:其对偶形式为:其中。则回归函数为:其中K(xi,x)为核函数,主要有以下几种类型:线性核函数:多项式核函数:径向基核函数:神经网络核函数:其中γ,r,d 是核参数
1.2 BP神经网络原理
BP(back propagation)网络,也就是误差反向传播网络,它共由3 层组成:输入层、隐藏层、输出层,方向是输入层到隐藏层,再到输出层,各层之间一般采用全互连方式,如图1,相邻的两层之间通过权值相连接,根据激活函数传到输出层,这种网络可以模拟任何连续有界的函数。BP 神经网络的步骤如下:第一步,初始化神经网络模型的参数,将神经网络中的连接权值Wij、λjt 和阈值θj、αt 赋予在(0,1)或(-1,1)之间,并设定误差函数e,计算精度ε 和最大学习次数M;第二步,随机选取第 个输入样本及期望输出:第三步,计算隐藏层各神经元的输入与输出;第四步,利用网络期望输出和实际输出,计算误差函数对输出层各神经元的偏导数δ0(k);第五步,利用隐藏层到输出层的连接权值、隐藏层和输出层的输出δ0(k),计算误差函数对输出层各神经元的偏导数δh(k);第六步,利用输出层各神经元的偏导数和隐藏层各神经元的输出来修正连接权值wh0(k),利用隐藏层和输入层各神经元的输入修正连接权值;第七步,计算全局误差,并判断网络误差是否达到所需要求,若不满足,则返回到第三步。
2 以创业板指数为例的实证分析
2.1 数据来源
本文以创业板指数2010 年6 月2 日到
2.2 支持向量回归(SVR)预测图1:BP 神经网络结构图表1:创业板指数
2.3 BP神经网络预测
将840 个样本数据的前640 个作为学习和训练,后200 个作为检验,经过了19 次迭代,在第13 次达到最佳,得到最好的的MSE= 5.59×10-5,时间仅用了2 秒。训练过程如图5。
3 结论分析
经过比对支持向量回归和BP 神经网络的运行结果,可以知道,虽然支持向量机的训练时间要长,迭代次数要多,但是均方误差要小,并且支持向量机的训练是一个二次规划的问题,它的解是全局最优解,而BP 神经网络是基于共轭梯度算法的,它很有可能会陷入局部最优解的陷阱,基于以上分析,在对小样本进行预测和分析时,支持向量机算法在预测的精度和全局最优性问题上都比BP 神经网络算法具有一定的优势,具有更高的应用价值。图2:创业板每日开盘指数时间序列图
参考文献
[1] 陈浩, 陈立辉, 毕笃彦等.BP 网络和支持向量机在非线性函数逼近中的应用[J].航空计算技术,2004,(3).
[2] 孙德厂, 史海波, 刘昶. 支持向量回归在不确定面向订单装配环境下交货期预测中的应用[J]. 航空计算技术,2013,33(8).
[3] 饶屾, 杨志平, 甘志刚.SVR 算法在指数预测中的应用研究[J]. 浙江交通职业技术学院学报,2012,13(4).
[4] 夏国恩, 邵培基. 改进SVR 在金融时间序列预测中的应用[J]. 金融理论与实践,2008,11:95-98.
[5]
[6]Pang-Ning Tan, Michael Steinbach,Vipin Kumar, Introduction to DataMining [M]. 机械工业出版社,2010.
作者单位
云南大学数学与统计学院 云南省昆明市650091