[统计学教程] 第五章时间数列

ago520

浏览: 258958 次
性别:
来自: 深圳

最近访客更多访客>>

jklwan

u012363178

adaya

qq113220715

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

导读：
　　第五章时间数列
　　
　　第一节时间数列的概念
　　
　　一．时间序列的构成
　　同类社会经济现象的统计资料，按时间先后顺序的排列，称为时间数列。
　　一个时间数列是受到若干个因素影响的，例如农产量，受到天气、病虫害、政策、价格等各种因素的影响，理论上说，是所有这些变量的函数。但这种研究方法，并不是统计的研究方法。统计学中对时间数列的研究，是忽略各个具体的非时间因素对时间数列的影响，而是将各种因素的出现看成在时间轴上必然的现象。因此，统计学中对时间数列的研究，是从时间轴出发的。
　　在统计中，研究时间数列的方法是将影响时间数列的因素分为下列四类。
　　1．长期趋势（Secular Trend）
　　指社会经济现象在较长的一段时间内所表现出来的稳定的趋势性。
　　例如我国的经济发展，从1949年以来，一直保持了较为稳定的增长的趋势。
　　2．季节变动（Seasonal Fluctuation）
　　社会经济现象表现出来的与日历周期同步的周期性。
　　例如商场中电风扇等具有鲜明季节特征的商品的销售量，就具有受季节变动影响很大的特点。在商场中，冬季的电风扇销售量很小，而夏季则增大。年复一年，这种规律与季节的变化是严格同步的，虽然有的年份早一些，有的年份晚一些。
　　需要注意的是，虽然与日历同步的周期性称为季节变动，但并不一定是指一年四季的概念。按月、按周、按天的循环变动，也可以称为季节变动。
　　例如，一个城市一天中的用电量就具有鲜明的季节特征，早晨上班的时候，各单位开始使用机器或者办公设备，城市用电量上升，到下班时，用电量下降。晚上天黑以后，照明用电增加，城市的总用电量达到高峰。当人们逐渐熄灯睡觉后，用电量下降到了最低点。这样周而复始，也可以表现为一种季节变动。
　　3．循环变动（Cyclical Movement）
　　循环变动也是一种周期性的变动，不过这种周期无法直接用日历周期来进行解释。一般来说，循环变动的周期往往比一年时间要长，根据周期的不同，一般又分为几级：
　　（1）短周期：一般在三至五年之内的周期；
　　（2）中周期：十至二十年的周期；
　　（3）长周期：二十年以上的周期。
　　4．不规则变动（Irregular Variations）
　　由各种无法解释的因素而引起的经济波动，一般不表现出明显的规律性。
　　不规则变动中，如果存在尚未被发现的系统性因素，就会出现残差异常的情况。
　　
　　二．时间序列的表现形式
　　时间序列的一般表现形式如下：
　　常见的简化模型包括两种：
　　加法模型：；
　　在加法模型中，构成时间序列的各个因素均是绝对量的形式，分别作为影响时间序列的一个组成部分，占有一定的比例。
　　乘法模型：
　　在乘法模型中，T是绝对量，而S、C和I均是以相对量的形式影响时间序列值，表现为对长期趋势的一个影响比例。从理论上说，这种模型更为合理。
　　更复杂的时间数列模型涉及到复杂的数列形式，在我们的课程中不予介绍。
　　
　　第二节趋势变动的测定
　　
　　趋势变动的测定目的在于从时间数列中分离出长期趋势值，测定趋势变动的方法包括两大类。
　　一．修匀方法
　　修匀方法是指从数列本身出发，通过平均的方法，消除数列的短期波动，使数列表现出稳定的趋势性。
　　修匀方法包括两类
　　1．时距扩大法
　　通过将计量统计指标的时间跨度加大，来获得一个相对平衡的序列，因为在较长的时间内，周期变动的影响和随机扰动，都会得到有效的平衡。
　　参见“汽车产量移动平均趋势”，以每三年为一个值，可以计算出一个时距。
　　2．移动平均法
　　时距扩大法最大的问题在于时间点减少，使序列表现得比较粗糙。移动平均法是将时距扩大法进行了一个平移，从序列顶端向下，选择N个时间点进行一次平均，然后将选择范围向下移动一个时间点，再进行一次平均，依次类推。每次平均的结果，记录在N个时间点的中间位置上。
　　参见下列“汽车产量移动平均趋势”。
　　
　　附表：汽车产量移动平均趋势
　　年份时间标号产量三年移动五年移动
　　1981 1 17.56
　　1982 2 19.63 20.39
　　1983 3 23.98 25.08 27.31
　　1984 4 31.64 33.11 31.19
　　1985 5 43.72 37.45 36.70
　　1986 6 36.98 42.63 44.80
　　1987 7 47.18 49.54 50.14
　　1988 8 64.47 56.67 51.68
　　1989 9 58.35 58.07 58.56
　　1990 10 51.40 60.39 70.46
　　1991 11 71.42 76.50 83.54
　　1992 12 106.67 102.65 99.21
　　1993 13 129.85 124.40 117.98
　　1994 14 136.69 137.27 133.20
　　1995 15 145.27 143.16 143.52
　　1996 16 147.52 150.35 150.15
　　1997 17 158.25 156.26
　　1998 18 163.00
　　
　　
　　
　　（1）对于奇数周期的移动平均法，计算出来的平均值直接记录在居中的时间点上；
　　对于偶数周期的移动平均法，则需要进行两次移动平均，第一次按偶数周期计算，结果分别写在居中的两个时间点中间，第二次再将居中的时间点两侧的两个移动平均结果再进行一次移动平均，计算出最终结果。
　　（2）移动平均法除了选择时距之外，还可以选择移动平均计算时的权重，以三年移动平均为例，如果在计算移动平均数时，不是采用简单移动平均，而是采用加权移动平均，则方式如下：
　　其中三个W的选择，决定了移动平均的效果。如果试图更多地保留原序列的面貌，则中间时间点的W应当大一点，两侧小一些；反之，则应当使两侧的权重与中间保持一致。
　　（3）移动平均法的时距选择是根据研究目的而定的：
　　如果研究的目的是为了将周期变动的影响去除掉，则移动平均的周期需要与实际经济波动的周期一致；
　　如果研究目的是为了修匀不规则变动，显示出周期的影响，则移动平均的周期应当大大地小于实际周期，并采用加权移动平均法，一定程度地突出实际数值。
　　
　　二．拟合方法
　　拟合方法是从数据的内在规律性出发，利用数学模型来对数列进行拟合处理，寻找最适合数列的数学模型，并以数学模型的规律来推断时间数列的规律。
　　要寻找时间数列的拟合模型，一般有两种方法
　　l 通过将时间数列在图上表现出来，直观地判断数列的数学规律性。例如，如果数列表现为直线型，则可用一次函数表示；如果数列表现为抛物型，则可以用二次函数表示，等等。
　　l 通过分析经济规律，使用已有的经济模型进行概括。例如逻辑斯蒂曲线，最早被用于研究人口增长规律，近代以来，又被广泛运用于研究成长现象。如果我们所研究的时间数列是具有成长特征的社会经济现象，则可以试着使用逻辑斯蒂曲线进行拟合。
　　进行数列拟合的方法有许多种，在此介绍两种简单的方法
　　1．分段平均法
　　分段平均法是一种进行曲线拟合的简单方法，其做法是将时间数列的各项数值平均分为几部分，分别求各部分的平均数，然后将各个平均数标在图上，由此确定两个点或者三个点，根据这些点确定对应的曲线。
　　分段平均法一般只限于在线性趋势或者抛物线型趋势的数列中使用，原理上说，只需要两个点即可确定一条直线，三个点可以确定一条抛物线。
　　参见下列“1978年至1992年针织内衣零售量”。
　　
　　附表：1978年至1992年针织内衣零售量
　　年份年份零售量（亿件）
　　1978 1 7.00
　　1979 2 9.10
　　1980 3 9.70
　　1981 4 10.80
　　1982 5 11.70
　　1983 6 12.10
　　1984 7 13.10
　　1985 8 14.30
　　1986 9 14.40
　　1987 10 14.80
　　1988 11 15.00
　　1989 12 12.30
　　1990 13 11.20
　　1991 14 9.40
　　1992 15 8.90
　　
　　
　　由曲线的图形，我们可以看到，1978至1992年针织内衣的零售量表现出抛物线形式，因此可以用二次曲线进行拟合。拟合形式为
　　将数据等分成三段，每五年为一段，分别计算每一段的X和Y坐标的平均值，获得三个平均值点为：（3，9.66），（8，13.74），（13，11.36），将三个平均值点的坐标代入上式，得下列方程组：
　　解上述方程组，得
　　即拟合模型为：
　　使用最小二乘方法拟合出来的结果为：
　　我们可以看到，在本题中，使用分段平均法所获得的结果，与使用更为精确的方法获得的结果差异是很小的，说明分段平均法可以作为其他方法的一种替代形式。由于分段平均法的计算过程比较简单，适合于在社会生产实践中，进行精度要求不太高的曲线拟合分析。
　　
　　2．最小二乘法
　　针对以下的一种曲线形式
　　对于已知的一组x和y，欲求一组a和b，使得估计值与观察值y之间的离差最小。
　　构造总离差函数Q如下
　　欲求一组a、b，使得Q达到最小值，根据微积分的原理，可以分别就a、b求Q的偏导数，并令偏导数为0，解联立方程得解如下：
　　对于大多数一元函数，最小二乘法都能够计算出唯一的一组a和b，使Q达到最小。但这并不意味着两个变量x和y之间一定存在线性关系，最小二乘法只提供求a和b的算法，但求出来的系数是否有意义，还需要进行检验。
　　参考以下的一个案例：
　　
　　附表：某社会经济现象中x与y的对应关系
　　X Y
　　12 9 144 108
　　14 12 196 168
　　18 20 324 360
　　16 16 256 256
　　20 25 400 500
　　22 30 484 660
　　24 36 576 864
　　10 6 100 60
　　10 4 100 40
　　
　　将上述各结果代入前面的求解公式，可得b=2.1408，a=-17.172。
　　因此，回归结果为
　　然而，如果我们把x和y的原始含义展示出来（下表），就会发现上述的回归事实上是荒谬的。x和y分别是一些矩形的面积和周长，我们知道矩形的面积与周长之间是不存在相关关系的。我们之所以能够求出一个面积与周长之间的函数关系，仅仅是因为我们对一组数据进行了最小二乘处理。最小二乘法在大多数情况下，都能够获得一个结果，但如果原始的数据之间事实上并不存在相关关系，这样求出来的结果，就仅仅是一个数字游戏，没有任何实际意义。
　　
　　附表：x和y的真实含义
　　矩形长矩形宽面积（ y ）周长（ x ）
　　3 3 9 12
　　3 4 12 14
　　4 5 20 18
　　4 4 16 16
　　5 5 25 20
　　6 5 30 22
　　6 6 36 24
　　3 2 6 10
　　4 1 4 10
　　
　　3．其他的拟合模型
　　观察下列的Logistic曲线，这是由比利时人口学家Verhulst定义，最早用于研究人口变化规律的。在近代，由珀尔和里德广泛运用于研究增长问题，又称为Pear-Reed成长曲线。
　　通过定义和，可以将这一模型转化线性模型，利用最小二乘法进行估计。需要说明的是，通过这样的转换方法进行的最小二乘估计，拟合出来的并不是最优的拟合曲线。
　　4．当代混沌理论对于长期预测的冲击
　　考察一个生物种群，假定生物的数量满足这样一个公式：
　　其中表示在T时间生物数量与环境可承受的数量的比重，当这一比重比较大时，由于环境压力大，生物大量死亡，从而下一期的数量减少，而另一方面，这一数量大，也表明繁殖机会增加，从而使下一期的数量增加。
　　经过实际的运算，当R＜2.5的时候，序列会收敛于0；当2.5＜R＜3时，序列稳定在某一数值上；当R＞3时，出现倍周期；当R＞3.5时，出现四周期，随后周期逐渐增加，直至无穷。
　　一个无穷的周期反映出序列出现了混沌现象。经济生活中的函数关系复杂性远远超出了上述的式子，因此经济规律很有可能会陷入一个无穷的周期，导致无法预测。
　　
　　第三节季节变动的测定
　　季节变动的测定目的在于计算出季节指数，季节指数反映季节的实际数量与理论数量的差异，通常用比值表示。
　　
　　一．按月（季）平均法
　　按月（季）平均法是将全年的总量分配到每个月份，作为当月的理论数量，再以各月的实际数量进行比较。
　　观察某商场一年中四个季节的衬衣销售量变化情况如下：
　　
　　年份春季夏季秋季冬季平均
　　1997年 3000 12000 6000 1200 5550
　　1998年 3500 13500 7000 1600 6400
　　1999年 3800 15000 8500 2100 7350
　　2000年 4200 17000 9300 2500 8250
　　2001年 4800 19500 10200 2900 9350
　　平均 3860 15400 8200 2060 7380
　　季节指数 52.30 208.67 111.11 27.91 400.00
　　
　　在上表中，计算五年中所有20个季度的总平均数为7380，再用每个特定季度的平均数除以7380，就可获得该季度的季节指数。
　　例如五年中春季的平均数为3860，除以7380得52.30％，所以春季的季节指数为52.30。
　　从这一结果中可以看到，所谓季度指数，是指该季节的某一现象，与全年的平均值相比，比值为多少。为了避免偶然因素对季度指数的干扰，往往要使用多个年份的结果来进行平均处理，从而获得一个较为稳定的指数。
　　
　　二．趋势剔除法
　　按月（季）平均法的优点在于简单易懂，但其缺点在于没有考虑到社会经济现象本身的趋势变动。从前一小节的例子中我们可以发现一个现象，同样是春季的销售量，2001年的数值比1997年高出50％以上，这意味着在整个序列中，除了存在季度的影响之外，还存在着增长趋势的影响。在存在趋势影响的情况下，夏季的销售量高于春季，除了有季节差异外，还有由于时间上的先后关系而存在的趋势差异。为了更精确地测定季度变动，就应当在计算时，首先把趋势变动的差异剔除掉。
　　趋势剔除法的核心在于充分考虑了长期趋势对于时间数列的影响，在计算各月的理论数量时，使用当月的趋势值代替年平均值。
　　具体步骤为：
　　1．利用移动平均法，求出对应各季的趋势值；
　　2．以各季的实际数量与趋势值相除，获得各季的季节变化情况；
　　3．将各年的同一季节情况进行平均，得各季未修正指数；
　　4．进行指数修正。
　　我们仍以前一小节的案例来进行计算，计算过程如下
　　
　　计算表：趋势剔除法计算季节指数
　　年份季节真实值第一次移动平均第二次移动平均季节变化
　　1997年春季 3000 　　　
　　夏季 12000 　　　
　　秋季 6000 5550 5612.5 106.90
　　冬季 1200 5675 5862.5 20.47
　　1998年春季 3500 6050 6175 56.68
　　夏季 13500 6300 6350 212.60
　　秋季 7000 6400 6437.5 108.74
　　冬季 1600 6475 6662.5 24.02
　　1999年春季 3800 6850 7037.5 54.00
　　夏季 15000 7225 7287.5 205.83
　　秋季 8500 7350 7400 114.86
　　冬季 2100 7450 7700 27.27
　　2000年春季 4200 7950 8050 52.17
　　夏季 17000 8150 8200 207.32
　　秋季 9300 8250 8325 111.71
　　冬季 2500 8400 8712.5 28.69
　　2001年春季 4800 9025 9137.5 52.53
　　夏季 19500 9250 9300 209.68
　　秋季 10200 9350 　　
　　冬季 2900 　　　
　　说明：首先我们使用移动平均法，计算各季度的趋势值。为了使计算结果中不残留季节影响，我们在选择移动平均周期的时候，应当使周期长度与季节变动的实际周期长度相一致，在本例中，应使用4个季度作为移动平均周期。（如果使用月度数据，则应当使用12个月作为移动平均周期，故趋势剔除法也称为12个月移动平均法）。
　　根据上一节的知识，当移动平均周期为偶数时，需要进行两次移动平均。
　　计算结果如上表中的第五列。
　　随后，我们用真实值与趋势值进行比较，即用第三列除以第五列，得出的结果如第六列所示。该列数据即为各个季度的季节变动比率。
　　为消除个别年份的特殊情况对季度指数的影响，我们使用若干年同一季度变动情况的平均值作为最终的计算结果，具体计算过程如下表。
　　
　　计算表：计算平均的季节变动及指数修正
　　1997 年
　　1998 年 1999 年 2000 年 2001 年未修正指数修正后指数
　　春季　 56.68 54.00 52.17 52.53 53.85 54.07
　　夏季　 212.60 205.83 207.32 209.68 208.86 209.71
　　秋季 106.90 108.74 114.86 111.71 　 110.55 111.01
　　冬季 20.47 24.02 27.27 28.69 　 25.11 25.22
　　398.37 400.00
　　修正系数 1.0041 　
　　
　　以各季度的平均值作为最终的季节指数，还需要进行一次修正。从上表中可以看到，根据各季度的平均数计算的季节指数之和（上表阴影处）为398.37，而理论上各季度的季节指数之和应当为400。两者之间存在的差异，是由于计算过程中的一些误差而造成的。
　　对指数进行修正的方法是先计算修正系数
　　
　　再用修正系数乘以各季未修正指数，即得各季的修正后指数，该指数即为最终的季节指数。
　　
　　第四节循环变动的测定
　　
　　一．利用残余法测定循环变动
　　残余法是利用的公式，在时间数列中一项一项地剔除掉其他因素，最后残余下来为C。
　　1．用趋势剔除法求出S，在序列中除掉S的影响；
　　2．求长期趋势T，在序列中剔除T；
　　3．用“一二一”加权移动平均，消除I。
　　
　　二．景气分析方法
　　1．景气分析的含义
　　景气是对经济发展状况的一种综合性描述，指经济活跃的程度。景气循环与宏观经济运行中的扩张与收缩、繁荣与萧条等有关，因此，景气循环实际上是宏观经济循环的表现。
　　经济波动由一个上升期或扩张期（Expansion）和随之而来的下降期或收缩期（Contraction）组成。进一步的细分，可分为四个阶段。
　　复苏期：recovery，由谷底到繁荣转折点
　　繁荣期：prosperty，由繁荣转折点到峰
　　衰退期：recession，由峰到萧条转折点
　　萧条期：depression，由萧条转折点到谷
　　2．景气指标的选择
　　景气监测指标的选择考虑如下六个因素：
　　（1）经济意义
　　考虑两点，一是经济活动进程的重要性，二是指标内涵的广度和深度。
　　（2）数据的可靠性和充分性
　　一般要求有8－10年，约100个月的样本数据才能满足分析的要求
　　（3）周期循环方向的一致性
　　指标的波动倾向与基准循环中波动的趋势基本一致
　　（4）周期时点出现频率的稳定性
　　时间序列的变动能呈现出周期性，并能说明和标出该周期的起迄时间，而且要求一个周期长度不得少于15个月，要求繁荣和衰退阶段不得少于5个月，以排除短期波动和不规则变动的影响。
　　（5）数列的平稳性
　　要求序列的随机扰动较小。
　　（6）数据的及时性
　　景气分析一般用于短期分析，因此数据的及时性非常重要。
　　3．国家统计局选择的景气指标
　　（1）先行指标（10项）：外贸出口收汇，农副产品收购额，钢材原材料库存，水泥原材料库存，木材原材料库存，基本建设财政拨款，财政支出，工业贷款，农业贷款，一次能源生产总额。
　　（2）同步指标（9项）：工业总产值，工业销售收入，国内商业纯购进，国内商业纯销售，社会商品零售额，货币供应量，银行现金工资性支出，铁路货运量，发电量。
　　（3）滞后指标（5项）：国内商业库存，基本建设投资完成额，财政收入，财政存款，商业贷款。
　　3．扩散指数的计算
　　分别根据不同指标类型，计算一组景气循环指标中扩张指标所占的比例。
　　：在所有指标中，扩张指标的个数。
　　扩张值取0，0.5，1三个值，最终计算，按其数值从0－1分为五段，分别以蓝、浅蓝、绿、黄、红五种灯号进行标注。

分享到：