建立ARIMA模型除了要求差分后的序列平稳以外,还要求该序列非白噪声。白噪声性也称为纯随机性,一个序列为白噪声序列,代表着该序列的变动是随机的、没有规律的,序列值之间没有任何相关性,序列的过去并不影响它未来的发展。此时序列将没有分析的价值,也无需建立模型对它进行分析。所以,分析研究的序列必须是非白噪声序列。下表1为白噪声检验结果。
平稳序列通常具有短期相关性,而长期延迟的序列值之间相关性较弱,故可检验延迟6期和延迟12期来判断序列是否为白噪声序列。在石油价格差分后的序列的检验结果中,延迟6期和延迟12期的P值小于0.05,故认为该序列属于非白噪声序列,即序列值之间存在相关关系,可对该序列进行建模分析。
5.模型识别与定阶
根据自相关系数与偏自相关系数的拖尾或者截尾可分别确定ARIMA(p,d,q)模型中的q和p。
由样本自相关图可看出,q可选择1或者2,根据样本偏自相关图,p可选0或者1。除了用样本自相关图和样本偏自相关图作粗略的判断外,还须用更精确的判断准则——BIC准则为模型定阶。BIC准则全称贝叶斯信息准则,由AIC准则即最小信息量准则发展而来。根据BIC准则,能使BIC函数达到最小的模型就是最优模型。与其他模型相比,当p=1,q=0时, BIC值最小,因而建立ARIMA(1,1,0)模型是最合适的。
6.建立ARIMA模型
一是模型拟合。设为石油价格,为石油价格的一阶差分,用SAS输出结果如图1。
即拟合得到的ARIMA模型为:
或可记作:xt=1.19302xt-1-0.19302xt-2+εt
模型中参数的t值为3.16,P值小于0.05,故模型的参数显著。
二是模型检验。拟合模型后需要检验残差序列是否还有未提取的信息,即检验残差序列是否纯随机序列,以此评价模型的拟合优度。图1中残差序列各滞后阶的P值均远大于0.05,表明残差序列为白噪声序列,残差序列基本上没有值得提取的信息,故该模型提取的信息量已经足够,模型的拟合效果好。
7.模型的预测
利用2008年4月至2016年5月石油价格的周数据建立的ARIMA(1,1,0)模型可预测2016年4月及5月上半旬每周的石油价格。
图2石油价格的拟合效果图显示出该模型的拟合与实际值较为符合,该模型拟合效果好。但石油价格的预测值与实际值相比有一定的偏差,预测的4期中误差百分比在1.68%-10.00%范围内波动。在前两期的预测中,误差百分比较小,尤其是第一期的预测值跟实际值相差很近,该预测是比较准确的。但是第三期的误差百分比就已达10%,随着预测期数的加大,模型的预测误差将越来越大,同等水平下的置信区间将逐渐变大,这也是利用ARIMA模型预测的缺陷。单从预测结果看,石油预测价格的波动幅度不大,略有上升趋势,而就目前国际上石油的整体形势而言,此预测结果是比较准确的。
三、结论
ARIMA模型假定事物的发展符合渐进的特征,过去的行为影响着当前和未来,而其他的影响因素对于过去、现在及将来的作用是不变或者变化较小,故可基于历史数据和确定趋势预测未来。ARIMA模型只需采取现有数据便可建模,与其他建立多因素的回归模型相比,无需考虑变量之间的协整关系以及多重共线性等问题,而且精度也比较高。在时间序列的发展模式方面,ARIMA模型不需要先验信息,在一定程度上放宽建模的要求,可通过反复识别修改获得理想的模型。但是,在序列预测方面,ARIMA模型只能较准确地对短期进行预测,预测区间变大,则模型预测误差也会增大,那么较远期预测的结果就没有很大的意义。当然,ARIMA模型也需要根据实际情况的变化,引入新的数据序列进行调整更换,这样才会使ARIMA模型的预测效果变得更好。