J9九游会:基于EMDARIMA组合模型的长江航运干散货运价指数预测
(武汉理工大学船海与能源动力工程学院1)武汉430063)(武汉理工大学交通
CBFI、国际(波罗的海)干散货运输市场的BDI和中国集装箱市场变化趋势的
CCFI等进行了研究.主流的研究方法有:GARCH模型、小波分析理论、支持向量
机(SVM)等.GARCH模型能够衡量波动的非均衡性,但精度无法保证;小波分析
过拟合导致预测失效[1-2].EMD是一种经验、直观、自适应的数据处理方法,
文中选取2009年5月—2021年4月YBFI月度数据为样本,结合“分解-预测-
杂性,再对分解序列进行预测,综合得出最终预测值,从而提高YBFI预测分析
YBFI时间序列具有含噪声、非线性、非平稳和多尺度性.现今对航运指数研究
基本是单一算法预测或针对序列整体进行建模[3],少有学者对数据的内在波动
采用EMD方法对YBFI序列进行降噪分解,得到不同频率周期相对稳定的YBFI
ARIMA模型或者Holt-Winters模型对子序列和趋势项进行预测,将各个IMF的
预测结果进行集成组合即得到最终的YBFI预测结果.YBFI预测模型构建流程见
平稳时间序列的前沿时频分析处理方法[5].分解得到不同波动时间尺度的IMF
ARIMA模型是将自回归过程(AR)与移动平均过程(MA)相结合的时间序列组合模
该模型的一般表示方式为:ARIMA(p,d,q)×(P,D,Q)S.其中:S为周期步长;
式中:{εt}为白噪声序列;Θ(B)为q阶移动平均系数多项式;Φ(B)为p阶自
回归系数多项式;▽为差分算子;B为滞后算子.在ARIMA建模过程中,建模的
重点在于确定(p,d,q)、(P,D,Q)的值.建模的主要思路[6]为:分析数据特
ARIMA建模的前提条件;根据ACF/PACF图形的峰值个数确定模型的参数,根据
由于2008年1月—2009年4月数据振幅较大,初步预测结果与现实情况不符.
为了准确预测长江航运干散货2021—2030年的运价指数数据,选取交通运输部
长江航务管理局官网公布的从2009年5月—2021年4月共144个样本数据.对
显著水平下的临界值,在10%置信水平下不拒绝存在单位根的假设,P值(0.167
EMD方法相比传统的小波分析、傅里叶分解方法存在一定的优势,EMD脱离了预
定好的基函数的约束,能够最大程度保留时间序列自身的特性.YBFI序列经EMD
由图5可知:IMF1的波动频率最高,并依次递减,平均振幅也从大到小变动,
表现出YBFI序列的内在多尺度波动特性.从周期性角度看,IMF1的周期最小,
初步分析是市场基础经济要素对YBFI序列的影响;IMF2、IMF3依次变大,初
步分析IMF2是政府宏观调控,定期出台的政策规定对YBFI的影响,而IMF3则
可能是航运市场重大事件影响,例如2008年金融危机、2020年新冠疫情等.趋
势项自2008年(根据官网数据可得)便呈现缓慢下降趋势,到2014年末2015年
初达到谷值,之后开始缓慢增长,查阅有关资料,航运市场中周期为10~15年
通过EMD分解将YBFI序列分解为相对平稳的IMF分量,将三个IMF分量运用
ARIMA模型或Holt-Winters指数平滑法进行比较、预测、分析,此类分析主要
在SPSS和Eviews软件中实现.趋势项Residual数列采用曲线拟合方法,根据
其分布特征和干散货运输市场的周期波动特性,运用MATLAB2018a实验平台进
行拟合研究,通过训练,发现三角函数对Residual数列的拟合效果较好.
IMF1 序列的波动特性.其拟合优度R2 为0.483(接近0.5,拟合较好),均方根
2) IMF2 拟合模型通过比较ARIMA 模型、指数平滑模型以及专家建模结果,发
现ARMA(4,7)能对IMF2 的周期、波动特性进行很好的预测.其R2 达到了一般线;均方根误差RMSE 仅为1.257;平均绝对误
3) IMF3 拟合模型通过比较拟合发现ARMA(6,1)能对IMF3 的特征数列进行较好
的拟合.在该模型拟合过程中,R2 为0.998,几乎等于1;均方根误差RMSE 与
平均绝对误差MAE 均处于较低区间,DW 值为1.912,说明拟合精度较优.
4) Residual 拟合模型趋势项主要反映了YBFI 序列在发展过程中的整体趋势和
变化周期.经过在MATLAB 实验平台中反复验算,调参,最终确定该序列的较优
从残差分布曲线,发现拟合效果较好,残差基本在[-0.95,0.60]之间,且平均
5) YBFI 预测结果由式(1),将上述经验模态分量和趋势项求和即可得到相应年
差均值仅为0.312 8(与0 无明显差异),说明总体误差水平较低;均方根误差
RMSE 为20.317,若以基期1 000 点算,均方根误差仅为2%,说明高值部分预
测效果较好;平均相对误差绝对值MAPE 为1.62%,在10%范围内,表明平稳部
分预测效果较好;平均绝对误差MAE=12.184;相对误差RE 中仅有五组数据超
过5%,2 组数据超过10%,占样本总数的比例分别为0.034 7、0.013 9,可忽
略不计,故可判断整体误差较低;R2 为0.973 5,说明该模型对YBFI 序列的预
将EMD-ARIMA 组合模型相关参数与传统、单一的季节性预测方法[8]进行对比,
总体来看,相比ARIMA 模型和简单季节模型,EMD-ARIMA 组合模型对YBFI 序列
的预测表现更优,说明EMD 分解能有效提取含噪声、非线性、非平稳性数据的
时间尺度特征,通过对本征模态变量IMF 和趋势项Residual 的预测结果进行重
由表4 可知:2022—2023 年,YBFI 将达到一个较高水平,之后又缓慢下跌,在
不考虑“通货膨胀”等因素的情况下,预计2030 年的YBFI 将处于一个较低的
1) EMD 模型能有效分解YBFI 序列,在保留数据自身的内在波动特性的同时对
3) EMD-ARIMA 组合模型预测效果和精度均优于传统单一的时间序列预测方法.
到较大幅度提升,其RMSE、MAPE、MAE 值(相比单一ARIMA 模型)分别下降了