当当当当现在开始跑程序了
我们鼡的是《商务与经济统计》中的时间序列分析基于R分析数据这是一个关于四年每个季度电视销售数量的数据,先上代码:
第一列是年份第二列是季度,第三列是销售量(每千台)
Step 2:绘制时间序列分析基于R图
这里的ts的是将数据转存到一个时间序列分析基于R对象中然后绘淛时间序列分析基于R图(忽略我丑丑的图)
从图中可以很明显地看出,曲线按年呈现类似周期性的变化且整体呈现上升趋势,因而为季節与趋势模式然后我们用decompose()函数对其进行分解。
Step 3:分解时间序列分析基于R
以上四幅图中分别为原始时间序列分析基于R数据、数据的趨势、季节性因素以及剔除了趋势和季节性因素之后的随机成分,我们可以将它们提取出来
从上图可以看出,每年第二季度销售量进入低谷第四季度达到高峰,这也明显对应着人们观看电视兴趣的直观期望即第二季度由于春季和初夏的户外活动,减少了潜在消费者观看电视的兴趣;第四季度由于冬季即将到来人们减少了户外活动因此电视购买模式趋向于峰值。
然后我们看一下消除季节影响的时间序列分析基于R:
消除季节影响后,可以看出电视的销售量呈现出逐年上升的趋势。
Step 4:预测未来一年的销售数量
在这里我们采用Holt-Winters指数平滑法对数据进行预测
由图知,曲线很好的拟合了原始数据然后我们要用forecast包预测未来一年的数据:
以上,我们预测了未来一年每个季度的數据并分别给出80%和95%的置信区间,然后画个图看看:
以上蓝色的部分就是预测值,阴影部分便分别是80%和95%的置信区间
至此,时间序列分析基于R分析就算完成了然后,我来说说一说我参考的资料吧:
《R语言与数据挖掘最佳实践与经典案例》 Yanchang Zhao 著