在时间序列预测中,平滑方法有助于过滤噪声并揭示潜在模式。两种最广泛使用的技术是移动平均和指数平滑。这两种方法都会为过去的观测值分配权重,但它们在处理近期数据与较旧数据的方式上存在根本差异。
让我们来探讨一下这些方法之间的差异以及它们的权重分配方案。
移动平均:对近期观测值赋予相等权重
移动平均(MA)通过平均过去固定数量(N)的观测值来平滑时间序列。在简单移动平均中:
例如,在5期移动平均中,最近的五个观测值中的每一个都被赋予0.2的权重,而较旧的观测值的权重为0。这可以在图中的黑色虚线中看到。
移动平均的优点
移动平均的缺点
指数平滑:优先考虑近期数据
与移动平均不同,指数平滑(ES)为较旧的观测值分配指数递减的权重。每个观测值的权重由一个平滑因子α(0 < α < 1)决定。
α决定了较旧观测值影响减弱的速度。
较高的α更强调近期观测值,而较低的α则将影响分散到更长时间范围的过去数据上。
不同α值的影响
如图所示,较低的α值类似于长尾移动平均,而较高的α值则更像加权移动平均,更强调最近的数据。
指数平滑的优点
指数平滑的缺点
在移动平均和指数平滑之间的选择
一般来说,当趋势较小且希望使用简单的平滑技术时,移动平均效果很好。而当近期数据更具信息性且需要考虑趋势时,指数平滑是更好的选择。
移动平均中窗口大小N对滞后的影响
移动平均最关键的缺点之一是滞后——即在检测底层时间序列变化时引入的延迟。窗口大小N越大,滞后越大。
理解移动平均中的滞后
由于移动平均通过平均最后N个观测值来平滑时间序列,因此它实际上会延迟对数据变化的识别。当趋势向上或向下转变时,移动平均只会逐渐调整到新的趋势,因为它包含了不再代表序列当前方向的过去值。
小N(例如,N=3)
大N(例如,N=10)
滞后为何重要
对于决策而言,滞后可能是一个问题,特别是在需要快速响应的应用中:
可视化滞后:N的影响
如果我们叠加多个具有不同N值的移动平均,可以看到:
这展示了一个基本的权衡:
与指数平滑的比较
指数平滑也会引入滞后,但由于近期观测值获得更多权重,因此其反应速度比具有相同平滑能力的移动平均更快。通过调整α(平滑参数),分析师可以控制响应性与滞后之间的权衡,类似于在移动平均中改变N。
明智选择N
在为移动平均选择N时,决策取决于所需的平滑性与响应性之间的平衡:
总之,滞后是平滑的代价,而在移动平均中选择的N是敏感性与延迟之间的直接权衡。
结论
移动平均和指数平滑都是时间序列预测中有用的技术,但它们服务于不同的目的。关键要点是,指数平滑能更好地适应近期变化,而移动平均则提供了一种稳定、直接的平滑方法。指数平滑中α的选择决定了响应性与稳定性之间的平衡,使用户能够根据其数据特性微调模型。
通过理解这些方法之间的权衡,分析师在进行时间序列数据预测和分析时可以做出更好的决策。