手机快速建站,开展网络营销的方式,沈阳男科正规医院,2024舆情信息范例8篇时间序列也称动态序列#xff0c;是指将某种现象的指标数值按照时间顺序排列而成的数值序列。时间序列分析大致可分成三大部分#xff0c;分别是描述过去、分析规律和预测未来#xff0c;本讲将主要介绍时间序列分析中常用的三种模型#xff1a;季节分解、指数平滑方法和AR… 时间序列也称动态序列是指将某种现象的指标数值按照时间顺序排列而成的数值序列。时间序列分析大致可分成三大部分分别是描述过去、分析规律和预测未来本讲将主要介绍时间序列分析中常用的三种模型季节分解、指数平滑方法和ARIMA模型并将结合Spss软件对时间序列数据进行建模。
注本文源于数学建模学习交流相关公众号观看学习视频后所作 时间序列
时间序列数据
对同一对象在不同时间连续观察所取得的数据。 例如1从出生到现在你的体重的数据每年生日称一次)。2中国历年来GDP的数据。3在某地方每隔一小时测得的温度数据。 时间序列概念 时间序列也称动态序列是指将某种现象的指标数值按照时间顺序排列而成的数值序列。
时间序列由两个组成要素构成 1第一个要素是时间要素 年、季度、月、周、日、小时、分钟、秒 2第二个要素是数值要素。
时间序列根据时间和数值性质的不同可以分为时期时间序列和时点时间序列。
时期序列中数值要素反映现象在一定时期内发展的结果时点序列中数值要素反映现象在一定时点上的瞬间水平。
区分时期和时点时间序列
例如 1从出生到现在你的体重的数据每年生日称一次)。 2中国历年来GDP的数据。 3在某地方每隔一小时测得的温度数据。 1和3是时点时间序列2是时期时间序列
时期序列可加时点序列不可加。 时期序列中的观测值反映现象在一段时期内发展过程的总量不同时期的观测值可以相加相加结果表明现象在更长一段时间内的活动总量 而时点序列中的观测值反映现象在某一瞬间上所达到的水平不同时期的观测值不能相加相加结果没有实际意义。 灰色预测模型里面有一个累加的过程 时间序列分解 因为时间序列是某个指标数值长期变化的数值表现所以时间序列数值变化背后必然蕴含着数值变换的规律性这些规律性就是时间序列分析的切入点。
一般情况下时间序列的数值变化规律有以下四种 一个时间序列往往是以上四类变化形式的叠加。
长期趋势T 长期趋势 (Secular trend,T) 指的是统计指标在相当长的一段时间内受到长期趋势影响因素的影响表现出持续上升或持续下降的趋势通常用字母 T 表示。例如随着国家经济的发展人均收入将逐渐提升随着医学水平的提高新生儿死亡率在不断下降。 季节趋势S 季节趋势(Seasonal Variation,S)是指由于季节的转变使得指标数值发生周期性变动。这里的季节是广义的一般以月、季、周为时间单位不能以年作单位。例如雪糕和棉衣的销量都会随着季节气温的变化而周期变化。每年的长假五一、十一、春节都会引起出行人数的大量增加。 百度指数 (baidu.com)
循环变动C 循环变动Cyclical Variation,C与季节变动的周期不同循环变动通常以若干年为周期在曲线图上表现为波浪式的周期变动。这种周期变动的特征表现为增加和减少交替出现但是并不具严格规则的周期性连续变动。最典型的周期案例就是市场经济的商业周期和的整个国家的经济周期。 不规则变动I 不规则变动Irregular Variation,I是由某些随机因素导致的数值变化这些因素的作用是不可预知和没有规律性的可以视为由于众多偶然因素对时间序列造成的影响在回归中又被称为扰动项。 以上四种变动就是时间序列数值变化的分解结果。有时这些变动会同时出现在一个时间序列里面有时也可能只出现一种或几种这是由引起各种变动的影响因素决定的。正是由于变动组合的不确定性时间序列的数值变化才那么千变万化。
四种变动与指标数值最终变动的关系可能是叠加关系也可能是乘积关系。
叠加模型和乘积模型
1如果四种变动之间是相互独立的关系那么叠加模型可以表示为 2如果四种变动之间存在相互影响关系那么应该使用乘积模型 注意
1数据具有年内的周期性时才能使用时间序列分解例如数据是月份数据(周期为12)、季度数据(周期为4) 如果是年份数据则不行。 2在具体的时间序列图上如果随着时间的推移序列的季节波动变得越来越大则反映各种变动之间的关系发生变化建议使用乘积模型反之如果时间序列图的波动保持恒定则可以直接使用叠加模型当然如果不存在季节波动则两种分解均可以。 小例子 随着时间变化搜索美赛数据的季节波动越来越大那么使用乘积模型会更精确。 随着时间变化销售数据的季节波动越来越大那么使用乘积模型会更精确。
Spss操作
Spss处理时间序列中的缺失值
1 缺失值发生在时间序列的开头或者尾部可采用直接删除的方法。 2缺失值发生在序列的中间位置则不能删除删除后原有的时间序列会错位可采用替换缺失值的方法。 替换缺失值的五种方法 Spss定义时间变量 时间序列图时序图 季节性分解 结果解读 画出分解后的时序图 时间序列分析 建立时间序列分析模型 指数平滑模型Spss官方文档 Simlpe模型 关于平滑系数的选取原则 1如果时间序列具有不规则的起伏变化但长期趋势接近一个稳定常数α值一般较小(取0.05‐0.02之间) 2如果时间序列具有迅速明显的变化倾向则α应该取较大值取0.3‐0.5 3如果时间序列变化缓慢亦应选较小的值一般在0.1‐0.4之间实际上Spss的专家建模如果选择了Simple模型用来估计那么软件会帮我们自动选取一个适合的平滑系数使得预测误差最小。 简单指数平滑法预测 线性趋势模型(linear trend) 参考7.2 Trend methods | Forecasting: Principles and Practice (2nd ed) (otexts.com) 阻尼趋势模型(Damped trend) 霍特趋势和阻尼趋势预测 7.2 Trend methods | Forecasting: Principles and Practice (2nd ed) (otexts.com) 简单季节性(Simple seasonal) 7.4 A taxonomy of exponential smoothing methods | Forecasting: Principles and Practice (2nd ed) (otexts.com) 温特加法模型(Winters additive) Forecasting: Principles and Practice (otexts.com) 温特乘法模型(Winters multiplicative) Forecasting: Principles and Practice (otexts.com) 温特加法和乘法预测 Forecasting: Principles and Practice (otexts.com) 一元时间序列分析的模型 下面的这些概念只介绍一个大概要完全弄懂还需要大家课后自己努力。如果实在学习这小部分有困难大家可以选择放弃理论部分不用细究每一个细节和概念我们的重心可以放在运用上。
1平稳时间序列和白噪声序列 2差分方程和滞后算子 3AR模型 4MA模型 5ARMA模型 6ACF和PACF 7ARMA模型的估计 8AIC和BIC准则 9ARIMA模型 10SARIMA模型 时间序列的平稳性(stationary series) 一些时间序列的图形 差分方程 将某个时间序列变量表示为该变量的滞后项、时间和其他变量的函数这样的一个函数方程被称为差分方程。 差分方程的齐次部分只包含该变量自身和它的滞后项的式子。 差分方程的特征方程
差分方程的齐次部分只包含该变量自身和它的滞后项的式子。 这p个解的模长实根取绝对值虚根取模的大小决定了形为ARMA(p,q)模型的{}是否平稳
滞后算子 MA模型、AR模型和ARMA(p,q)模型
AR(p)模型(auto regressive) AR(p)模型平稳的条件 小例子 MA(q)模型(moving average) MA模型和AR模型的关系 MA(q)模型的平稳性 只要q是常数那么MA(q)模型一定是平稳的。 ARMA(p,q)模型 自回归移动平均模型(Autoregressive Moving Average,ARMA)就是设法将自回归过程AR和移动平均过程MA结合起来共同模拟产生既有时间序列样本数据的那个随机过程的模型。 ARMA(p,q)模型的平稳性 ACF自相关系数 PACF偏自相关函数 AR(1)模型(系数符号相反) Walter Enders《Applied Econometric Time Series Fourth Edition》
MA(1)和AR(2)模型 ARMA(1,1)模型和总结表格 ARMA模型的识别 图1和图2上均有两条蓝色的线其表示假设检验对应的上下临界值如果自相关系数或偏自相关系数位于这两条线内则认为它们与0没有显著的差异。 正确识别ARMA模型的阶数太难了
ARMA模型的估计 ARMA模型的极大似然估计第四章 极大似然估计 - 百度文库 (baidu.com) 模型选择AIC和BIC准则选小原则 过拟合问题加入的参数个数越多模型拟合的效果越好但这却是以提高模型复杂度为代价的。因此模型选择要在模型复杂度与模型对数据的解释能力之间寻求最佳平衡。 AIC和BIC是选小原则我们要选择使得AIC或BIC最小的模型。 BIC对于模型的复杂程度的惩罚系数更大因此BIC往往比AIC选择的模型更简洁 检验模型是否识别完全 估计完成时间序列模型后我们需要对残差进行白噪声检验如果残差是白噪声则说明我们选取的模型能完全识别出时间序列数据的规律即模型可接受如果残差不是白噪声则说明还有部分信息没有被模型所识别我们需要修正模型来识别这一部分的信息。 ARIMA(p,d,q)模型 ARIMA(1,1,1)时间序列图 x ‐ arima.sim(list(order c(1,1,1), ar 0.6, ma‐0.5), n 100)
ARIMA(1,2,1)时间序列图 x ‐ arima.sim(list(order c(1,2,1), ar 0.6, ma‐0.5), n 100) SARIMA(Seasonal ARIMA)模型 到目前为止我们只关注非季节性数据和非季节性ARIMA模型。然而ARIMA模型也能够对广泛的季节数据进行建模。 季节性ARIMA模型是通过在ARIMA模型中包含额外的季节性项而生成的其形式如下 Spss时间序列建模的思路
下面的步骤是自己在思考建模的过程不是写在论文中的
1处理数据的缺失值问题、生成时间变量并画出时间序列图 2数据是否为季度数据或者月份数据至少有两个完整的周期即两年如果是的话则要观察图形中是否存在季节性波动。 3根据时间序列图大致判断数据是否为平稳序列数据围绕着均值上下波动无趋势和季节性 4打开Spss分析‐‐时间序列预测—创建传统模型高版本的Spss可能才有这个功能看看Spss专家建模器得出的最优的模型类型。 5如果最后的结果是ARIMA(p,0,q)模型那么我们就可以画出时间序列的样本ACF和PACF图形进行分析如果得到的是ARIMA(p,1,q)模型我们可以先对数据进行1阶差分后再用ACF和PACF图形分析如果得到的结果与季节性相关那么我们可以考虑使用时间序列分解。 例题1销量数据预测 前期准备工作
下面的步骤是自己在思考建模的过程不是写在论文中的
1数据为季度数据有四个周期从图中看出也有季节性波动即第二季度的销量较高第四季度较低 2根据时间序列图可知数据不平稳有向上的趋势 3Spss的专家建模给出的最合适的模型是温特加法模型 4温特加法模型意味着原时间序列数据含有线性趋势和稳定的季节成分我们可以使用加法时间序列分解 5利用Spss我们可以对未来两年的销售数据进行预测。 Spss时间序列建模器 默认在所有的指数平滑模型和ARIMA模型中选择合适的模型。
自动检测异常值的方法 操作步骤 注: 1预测值和拟合值是不相同的预测值是将样本外年份的数据带入模型计算得到的而拟合值是将样本的年份重新带入模型计算得到的。 2这里保留残差的ACF和PACF图形可以帮助我们判断残差是否为白噪声即该时间序列是否能被模型识别完全。 常用的评价指标 参数估计值表格 白噪声进行残差检验 预测的结果和效果图 例题2人口数据预测 预测结果 残差的白噪声检验 预测效果图形 例题3上证指数预测 直接进行专家建模的结果 剔除异常值后重新建模 预测效果 例题4GDP增速预测 用所有数据进行预测剔除异常值 出错的原因 课后作业 结语
没有结语挺多的今天好好看好好学ヾ(▽)Bye~Bye~