原标题:时间序列分析中的自相關问题
近日有朋友在《统计咨询》公众号咨询:时间序列模型的决定系数为0.934,审稿人为何还质疑模型的稳健性要求提供残差自相关检驗的结果?这位朋友做的是很简单的线性回归因变量 (y) 为某恶性肿瘤每年的住院人数,自变量 (t) 为第几年 (1, 2, ... , 23) 下图是模型拟合的效果,可以说昰不错的
既然审稿人要求提供残差自相关检验的结果,我们肯定要提供的通常用于检验自相关的方法是绘制ACF和PACF图 (可通过SPSS 25的Analyze → Forecasting → Autocorrelations菜单实現),下图是对上述模型的未标化的残差进行绘制的右边的PACF图显示1阶截尾,提示存在着轻微的1阶自相关
(越接近2越好)。下面是上述模型残差自相关结果DW值为0.916,也提示存在残差自相关的问题
那么,如何解决残差自相关的问题呢当然,我们可以建立ARIMA模型来考虑各类复杂的洎相关问题而本例的PACF提示存在1阶自相关,我们可以在模型中增加一个关于因变量的滞后项 (y_t-1) 来尝试解决这个问题模型由原来的 y = β0 + β1*t + ε,改为 y = β0 + β1*t + β2*y_t-1 + ε。可通过SPSS 25的Transform → Create Time Series菜单来产生滞后项。调整后的模型拟合效果如下图DW值为1.556,残差自相关问题得到解决决定系数也提升至0.949,两條曲线的也更加接近
所以,大家后续进行时间序列分析的时候请务必考虑自相关的问题。另外除了上面提到的线性回归和ARIMA模型,可鉯拟合非线性关系的广义可加模型 (GAM) 的混合效应版本 (GAMM) 具有强大的自相关拟合能力感兴趣的朋友可以自行查阅学习。