您好,欢迎来到刀刀网。
搜索
您的当前位置:首页基于模式匹配识别和神经网络的股指预测研究

基于模式匹配识别和神经网络的股指预测研究

来源:刀刀网
2014年9月 重庆文理学院学报 Sep.,2014 第33卷第5期 Joumal of Chongqing University of Arts and Sciences Vol_33 No.5 基于模式匹配识别和神经网络的股指预测研究 喻丽春 (福州外语外贸学院,福建福州350007) [摘 要]股票市场是个非线性系统,由于受到多方面因素的影响,对于股指的预测一直是个 难题.各种建模方法都有自身的缺点,如模式匹配识别系统过分依赖历史数据,缺乏自身变化. BP神经网络容易陷入局部最优,而且训练时间较长.文章从模式匹配识别和BP神经网络相 结合的角度来进行股票指数预测分析,预测系统克服了单一神经网络预测系统和单一模式匹 配识别预测系统的各自缺点,能有效地预测股指. [关键词]模式匹配识别系统;BP神经网络;预测;股票 [中图分类号]TP311 [文献标志码]A[文章编号]1673—8004(2014)05—0040—04 股票指数是描述股票市场总的价格水平变 数据,并根据最接近的历史时间序列数据段的最 化的指标.它是选取有代表性的一组股票,把它 后一个节点的升降趋势,预测未来的时间序列数 们的价格进行加权平均,通过一定的计算得到. 据趋势.实现模式匹配识别系统的步骤如下: 在金融数据挖掘方面,股票指数预测一直是个比 (1)选择历史数据 较热门的研究领域.近年来,国内外很多计算机 历史数据在模式匹配识别系统中有着很重 学者将神经网络、遗传算法、模式匹配识别H l2 等 要的作用.根据多次实验,选取一段长度为n的 算法思想应用于股票的预测和分析,取得了很大 数据序列,/'L为250~400时最为合适.假设所选 的成功.但由于股票指数受多方面因素的影响, 取的历史时间数据序列为: 各种算法都有固有的缺点和优点.人工神经网络 Y={Y1,Y2,…,Y } 具有广泛的学习能力和适应能力,但容易陷入局 选择最近一段长度为k+1的时间序列数 部最优,从而影响模型的建立和可靠性.模式匹 据,该时间序列数据可表示如下: 配识别方法是以历史数据来进行预测,具有较好 】,c={Y ,Y + 一,Y ,Y } 的拟合度 ,但股指不仅仅是重复过去,随着时 Y 代表今天的股票指数,Y 为昨天的股票 间的推移有着自身的变化规律.所以将人工神经 指数,如此类推.k+1为其序列数据的个数,它的 网络和模式匹配识别进行结合,能够扬长避短, 长短将对预测结果产生重要影响.太长或太短都 取得更好的预测结果. 将干扰预测的准确性. 最适合的值在程序中根 1模式匹配识别预测系统 据预测值的相对误差和准确率确定.根据实验结 果,k的值在2~6之间. 模式匹配识别系统最重要的步骤是确定与 (2)最近似匹配时间序列数据 当前时间序列数据趋势最接近的历史时间序列 模式匹配识别系统的关键步骤是匹配,如何 [收稿日期]2013—12—27 [作者简介]喻丽春(1984一),女,福建莆田人,讲师,硕士,主要从事森林生态与湿地环境保护方面的研究 40 在过去的历史数据中找出与当前时间序列数据 最近似的序列是最主要的问题.假设最近似的序 列为: =天数,ER的值越接近于0.预测多天的数据,可利 用滚动的方式,把预测值也加入到历史数据中, 重复上面的步骤. {Yj 一,Y1_l,Yj} 对原来的数据序列l,进行处理,产生两个新 2神经网络预测系统 的数据序列: C={c1,c2,…,c } D={D1,D2,…,D 一l} c为股票指数升降趋势序列,其构造方法如下: C:fc = ,(), >Yi) LCf=0,(Y ≤Y ) D为股票指数变化数据序列,其构造方法如下: D Y +1一Y 在序列C里面寻找与数据段相匹配的01数 据段c ,可得到一个或多个与C 相匹配的数据 段c。.比较它们在序列y里面相对应的数据段l/c 和数据段 的差异distance,记为D.计算方法如 下: D=l D 一2一D卜2 l+I D 一1一D 一1  ID为两个数据序列的差异,其值越接近零, 则表示两个数据序列之间的差异越小. (3)确定股票预测指数 假设找到与时间序列数据c 最接近的时间 序列C。,表示方法如下: C ={C 一2,C 一1} Cp={C,一2,Cf一1} 假设C =1,那么可以预测C =1,从而可 以知道明天的股票指数yn+。将比今天的高. 计算y 的值的公式如下: Yn+1 yn+ + × (4)误差计算 可采用预测结果的趋势准确率与平均相对 误差评价预测结果.当预测趋势和实际一致时, 计算器rightdirection加1.n天的预测结果趋势准 确率E 的计算方法如下: ET=100×rightdirection/ n天的预测值平均相对误差的计算公式如下: ER=∑(I 一 I/ )/ 其中,y 为预测的股指, 为实际股指, 为预测 神经网络在预测非线性系统方面有着很大 的优势,它通常用历史数据来训练网络,并利用 在时间上最靠近预测数据的几个时间序列数据 来预测实际输出.BP算法是神经网络中应用最 为广泛的一种学习算法 ]. 2.1 BP算法的基本实现步骤 (1)网络初始化,权值的初始值用小随机数 设定. (2)输入向量输入到输入层,并传播到各神 经元. (3)向输出层输入教师信号. (4)误差逆传播的权值学习. (5)计算样本的误差,如样本误差小于预设误 差,则保存权值退出;否则,返回到步骤2继续训练. 2.2预测实现 为提高神经网络的训练速度,首先对样本进 行归一化操作.处理方法是分别用mct ̄.、min记 录样本里面输入输出的最大最小值,然后对每个 样本值归一化处理.公式如下: S=(Js—min)/(m0 一min) 对于初始权值,取0~1之间随机数.输入归 一化后的样本时,为防止样本的输入顺序对训练 结果产生较大影响,可采用循环输人的方法,并 通过样本的输人数据计算输出向量0.比较输出 向量0和教师数据 ,计算其均方误差: tt, ,E =1/2∑(k=l  一Ok) 其中i表示第i个样本.接着反向传播,计算输出 层到隐层的 ,采用的激励函数为Sigmoid函数. 激励函数导数公式如下: 厂( )= )×[1-f( )] 6的计算公式如下: 6=[(1—0 )・0 ]×[ 一0 ] 调整隐层到输出层的权值: = +aSkHh 其中:k为输出层的第 个节点, 为隐层节点中 41 的第_『个节点的输出,。为学习效率.在调整输入 层到隐层的权值之前,需计算输入层到隐层的6, 为了区别前面输出层到隐层的 ,此处使用A表 隐层节点定为l0个,并设置输入层到隐层、隐层 到输出层的学习效率均为0.7。当全局误差小于 0.005时,训练完毕.训练完成时,权值将被保存 到文件weight.flay.采用模式匹配识别系统读人 需预测的数值序列前270 d的时间序列数据,产 生30 d的预澳4数据序列,将其作为神经网络的 输入,并从weight.SaV文件读取权值,输出结果 示。先计算来自紧接其后层的 的附加权值和6 , 计算公式如下: =∑ 再计算A值,计算公式如下: Af=[(1一 ) ]・6 计算调整输入层到隐层的权值: f= f+bA X 其中: 为第i个输入节点到第 个隐层节点的 权值,b为学习效率.累加n个样本的全局误差. 如果全局误差小于预定值preErr,则训练完毕; 否则,改变 个样本的输人次序,继续训练. 3基于模式匹配识别和神经网络的预测 系统 基于模式匹配识别和神经网络的预澳4系统 流程图如图1所示. 竺H H鼙 l t,-O 史戢蛔虫障慨 模式 嘲搦卅僚一 I ,练样本H 端簧 H 嚣霭肇H预测结粜 图1预测系统流程圈 假设需要预测3O个连续的预测值,预测值 为P (1≤i≤30).同时其对应的实际值为尺 (1 ≤ ≤30).可将预测值和实际值分成5组,得到 如表1所示的5个样本: 表1 样本列表 由表1可知,输入节点和输出节点都为6 个.隐层节点太多或太少都将不利于预测的最终 效果.在经过实验数据的预测效果对比之后,将 42 为最终预测值. 4实验结果分析 采用基于模式匹配识别和神经网络的预测 系统预测上证指数3个不同时间段的数据.具体 时间段如下: 2012.12.06 ̄2013,01.21: 2013。O1.22 ̄2013.03.11; 瓤穰蝌叫 2013.03.12—_20l3.04.24. 獬 撕 预测天数分别为30个交易日.预测结果分 别如图2、图3、图4所示.图中空心正方形实线 为真实值,空心圆形实线为模式匹配识别预测 值,空心三角形虚线为混合系统预测值.实验结 果显示:该系统的预测值和预测趋势更接近于实 际值,预测结果具有一定的准确性和实用性. 1 3 d 5日7 8 9 101.12伯14151日171日1920 1船柏 两2日27弛 3n 时 竹 艇甘幡式秭犯鞭渊城 眶 翔一值I 图2 2012.12.06—20l3.01。21预测结果 a 4 E日1 B自1a¨ 13I415IB171B19 1 船 孙强∞ 舶3O 时问 lL廿鼻蜜担啼攥式琏鬻两■博・拇☆确 值l — ... . ,------,- -------------u u — - ——— ———,——.——— ,.. ..,.. 圈3 2013.O1.22—2O13.03.11预测结果 嘏 叫 M职加 ∞ 如伯 济因素的影响,是值得我们继续思考的问题. [参考文献] [1]Sameer S,Jonathan F.Pattern matching and neural net— works based hybrid forecasting system[J].Advances in Pattern Recognition。2001:72—82. 2 3 4 5 6 7日0 1a1t 1j131415151l1e1●202I 22i324 25 2627 282g 竹阿 [2]Sameer S.Fuzzy nearest neighbour method for time— series forecasting[C].Proc.6th European Congress on Intelligent Techniques and Soft Computing,1998:1901 匝圃叵亟 图4 2013.03.12—2013.04.24预测结果 —1905. 5 结论 [3]胡金柱,熊春秀,舒江波,等。一种改进的字符串模式 匹配算法[J].模式识别与人工智能,2010。23(1): 由实验测试结果可知:模式匹配识别和神经 103—1o6. 网络相结合在总体上比单用模式匹配识别进行 [4]黄华,罗四维,李爱军,等.实现人工神经网络知识增 预测的效果更好.该混合系统在绝大多数情况下 殖能力的一种方法[J].计算机研究与发展,2004,41 预测值逼近于真实值,预测结果良好.但是,由于 (7):21—26. 训练样本个数偏少,可能使预测效果并没有达到 [5]李炯城,黄汉雄.一种新的快速BP神经网络算法 最佳状态.如何改善算法,使混合系统的预测能 QLMBP[J]。华南理工大学学报:自然科学版。2006, 力更强,如何克服股票市场外在的人为因素和经 34(6):49—54. Predicting stock——index using pattern matching and neural networks system YU Lichun (Fuzhou University of Foreign Studies and Trade,Fuzhou Fujlan 350007, 日) Abstract:Stock market is a nonlinear system.Because of its instability to some degree,it’s dififcult to predict the stock—index。Some models have their own disadvantage,such as pattern modeling and recogni— tion system rely on the historic data excessively,lacking its own variability.Neural networks is easy to get stuck local optimum and the training time is too long.Based on pattern matching and neural networks,a hybrid system for forecasting stock—index is proposed in this paper.This system can overcome the disadvan- tage of single neural networks system and single pattern modeling and recognition system,and efifciently predict the stock—index. Key words:pattern modeling and recognition system;BP neural networks;forecast;stock (责任编辑穆刚) 43 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- gamedaodao.com 版权所有 湘ICP备2022005869号-6

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务