
格兰杰因果关系
请客-窗前的树
2023年3月20日发(作者:观察秋天的作文)格兰杰因果检验简要介绍
格兰杰(Granger)因果性检验目前在计量经济学中应用比较多,不过我们当初学习计量并没有学这个
检验方法,经济学专业的学生应该会学到吧。上次谭英平师姐给我们讲宏观经济统计分析课时曾经给我们
介绍过,不过也只是很肤浅地说了说原理(这种教学有一定的危险性啊)。
要探讨因果关系,首先当然要定义什么是因果关系。这里不再谈伽利略抑或休谟等人在哲学意义上所
说的因果关系,只从统计意义上介绍其定义。从统计的角度,因果关系是通过概率或者分布函数的角度体
现出来的:在宇宙中所有其它事件的发生情况固定不变的条件下,如果一个事件A的发生与不发生对于另
一个事件B的发生的概率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事
件在时间上又先后顺序(A前B后),那么我们便可以说A是B的原因。
早期因果性是简单通过概率来定义的,即如果P(B|A)>P(B)那么A就是B的原因(Suppes,1970);
然而这种定义有两大缺陷:一、没有考虑时间先后顺序;二、从P(B|A)>P(B)由条件概率公式马上可以推
出P(A|B)>P(A),显然上面的定义就自相矛盾了(并且定义中的“>”毫无道理,换成“<”照样讲得通,后来
通过改进,把定义中的“>”改为了不等号“≠”,其实按照同样的推理,这样定义一样站不住脚)。
事实上,以上定义还有更大的缺陷,就是信息集的问题。严格讲来,要真正确定因果关系,必须考虑
到完整的信息集,也就是说,要得出“A是B的原因”这样的结论,必须全面考虑宇宙中所有的事件,否则
往往就会发生误解。最明显的例子就是若另有一个事件C,它是A和B的共同原因,考虑一个极端情况:
若P(A|C)=1,P(B|C)=1,那么显然有P(B|AC)=P(B|C),此时可以看出A事件是否发生与B事件已经没有
关系了。
因此,Granger(1980)提出了因果关系的定义,他的定义是建立在完整信息集以及发生时间先后顺
序基础上的。至于判断准则,也在逐步发展变化:
最初是根据分布函数(条件分布)判断,注意Ω
n
是到n期为止宇宙中的所有信息,Y
n
为到n期为止
所有的Y
t
(t=1…n),X
n+1
为第n+1期X的取值,Ω
n
-Y
n
为除Y之外的所有信息。
F(Xn+1|Ωn)≠F(Xn+1|(Ωn−Yn))-------(1)
后来认为宇宙信息集是不可能找到的,于是退而求其次,找一个可获取的信息集J来替代Ω:
F(Xn+1|Jn)≠F(Xn+1|(Jn−Yn))-------(2)
再后来,大家又认为验证分布函数是否相等实在是太复杂,于是再次退而求其次,只是验证期望是否
相等(这种叫做均值因果性,上面用分布函数验证的因果关系叫全面因果性):
E(Xn+1|Jn)≠E(Xn+1|(Jn−Yn))-------(3)
也有一种方法是验证Y的出现是否能减小对X
n+1
的预测误差,即:
σ2(Xn+1|Jn)<σ2(Xn+1|(Jn−Yn))-------(4)
最后一种方法已经接近我们最常用的格兰杰因果检验方法,统计上通常用残差平方和来表示预测误差,
于是常常用X和Y建立回归方程,通过假设检验的方法(F检验)检验Y的系数是否为零。
可以看出,我们所使用的Granger因果检验与其最初的定义已经偏离甚远,削减了很多条件(并且由
回归分析方法和F检验的使用我们可以知道还增强了若干条件),这很可能会导致虚假的因果关系。因此,
在使用这种方法时,务必检查前提条件,使其尽量能够满足。此外,统计方法并非万能的,评判一个对象,
往往需要多种角度的观察。正所谓“兼听则明,偏听则暗”。诚然真相永远只有一个,但是也要靠科学的探
索方法。
经济学家开拓了一种可以用来分析变量之间的因果的办法,即格兰杰因果关系检验。该检验
方法为2003年诺贝尔经济学奖得主克莱夫·格兰杰(r)所开创,用于
分析经济变量之间的因果关系。他给因果关系的定义为“依赖于使用过去某些时点上所有信
息的最佳最小二乘预测的方差。”
在时间序列情形下,两个经济变量X、Y之间的格兰杰因果关系定义为:若在包含了
变量X、Y的过去信息的条件下,对变量Y的预测效果要优于只单独由Y的过去信息对Y进
行的预测效果,即变量X有助于解释变量Y的将来变化,则认为变量X是引致变量Y的格兰
杰原因。
进行格兰杰因果关系检验的一个前提条件是时间序列必须具有平稳性,否则可能会
出现虚假回归问题。因此在进行格兰杰因果关系检验之前首先应对各指标时间序列的平稳性
进行单位根检验(unitroottest)。常用增广的迪基—富勒检验(ADF检验)来分别对各指标
序列的平稳性进行单位根检验。
格兰杰因果关系检验假设了有关y和x每一变量的预测的信息全部包含在这些变量
的时间序列之中。检验要求估计以下的回归:
(1)
(2)
其中白噪音u1t和u2t假定为不相关的。
式(1)假定当前y与y自身以及x的过去值有关,而式(2)对x也假定了类似的
行为。
对式(1)而言,其零假设H0:α1=α2=…=αq=0。
对式(2)而言,其零假设H0:δ1=δ1=…=δs=0。
分四种情形讨论:
(1)x是引起y变化的原因,即存在由x到y的单向因果关系。若式(1)中滞后的x
的系数估计值在统计上整体的显著不为零,同时式(2)中滞后的y的系数估计值在统计上
整体的显著为零,则称x是引起y变化的原因。
(2)y是引起x变化的原因,即存在由y到x的单向因果关系。若式(2)中滞后的y
的系数估计值在统计上整体的显著不为零,同时式(1)中滞后的x的系数估计值在统计上
整体的显著为零,则称y是引起x变化的原因。
(3)x和y互为因果关系,即存在由x到y的单向因果关系,同时也存在由y到x的单
向因果关系。若式(1)中滞后的x的系数估计值在统计上整体的显著不为零,同时式(2)
中滞后的y的系数估计值在统计上整体的显著不为零,则称x和y间存在反馈关系,或者双
向因果关系。
(4)x和y是独立的,或x与y间不存在因果关系。若式(1)中滞后的x的系数估计
值在统计上整体的显著为零,同时式(2)中滞后的y的系数估计值在统计上整体的显著为
零,则称x和y间不存在因果关系。
三、格兰杰因果关系检验的步骤
(1)将当前的y对所有的滞后项y以及别的什么变量(如果有的话)做回归,即y对y
的滞后项yt-1,yt-2,…,yt-q及其他变量的回归,但在这一回归中没有把滞后项x包括进来,
这是一个受约束的回归。然后从此回归得到受约束的残差平方和RSSR。
(2)做一个含有滞后项x的回归,即在前面的回归式中加进滞后项x,这是一个无约束
的回归,由此回归得到无约束的残差平方和RSSUR。
(3)零假设是H0:α1=α2=…=αq=0,即滞后项x不属于此回归。
(4)为了检验此假设,用F检验,即:
它遵循自由度为q和(n-k)的F分布。在这里,n是样本容量,q等于滞后项x的个
数,即有约束回归方程中待估参数的个数,k是无约束回归中待估参数的个数。
(5)如果在选定的显著性水平α上计算的F值炒股临界Fα值,则拒绝零假设,这样
滞后x项就属于此回归,表明x是y的原因。
(6)同样,为了检验y是否是x的原因,可将变量y与x相互替换,重复步骤(1)~
(5)。
格兰杰因果关系检验对于滞后期长度的选择有时很敏感。其原因可能是被检验变量
的平稳性的影响,或是样本容量的长度的影响。不同的滞后期可能会得到完全不同的检验
结果。因此,一般而言,常进行不同滞后期长度的检验,以检验模型中随机干扰项不存在序
列相关的滞后期长度来选取滞后期。
格兰杰检验的特点决定了它只能适用于时间序列数据模型的因果性检验,无法检验
只有横截面数据时变量间的因果性。
可以看出,我们所使用的Granger因果检验与其最初的定义已经偏离甚远,削减了
很多条件(并且由回归分析方法和F检验的使用我们可以知道还增强了若干条件),这很
可能会导致虚假的因果关系。因此,在使用这种方法时,务必检查前提条件,使其尽量能够
满足。此外,统计方法并非万能的,评判一个对象,往往需要多种角度的观察。正所谓“兼
听则明,偏听则暗”。诚然真相永远只有一个,但是也要靠科学的探索方法。
值得注意的是,格兰杰因果关系检验的结论只是统计意义上的因果性,而不一定是
真正的因果关系。虽然可以作为真正的因果关系的一种支持,但不能作为肯定或否定因果
关系的最终根据。当然,即使格兰杰因果关系不等于实际因果关系,也并不妨碍其参考价值。
因为统计意义上的因果关系也是有意义的,对于经济预测等仍然能起很大的作用。
由于假设检验的零假设是不存在因果关系,在该假设下F统计量服从F分布,因此
严格地说,该检验应该称为格兰杰非因果关系检验。
要探讨因果关系,首先当然要定义什么是因果关系。这里不再谈伽利略抑或休谟等人在哲学
意义上所说的因果关系,只从统计意义上介绍其定义。从统计的角度,因果关系是通过概率
或者分布函数的角度体现出来的:在宇宙中所有其它事件的发生情况固定不变的条件下,如
果一个事件A的发生与不发生对于另一个事件B的发生的概率(如果通过事件定义了随机
变量那么也可以说分布函数)有影响,并且这两个事件在时间上又先后顺序(A前B后),
那么我们便可以说A是B的原因。
早期因果性是简单通过概率来定义的,即如果P(B|A)>P(B)那么A就是B的原因(Suppes,
1970);然而这种定义有两大缺陷:一、没有考虑时间先后顺序;二、从P(B|A)>P(B)由条
件概率公式马上可以推出P(A|B)>P(A),显然上面的定义就自相矛盾了(并且定义中的“>”
毫无道理,换成“”改为了不等号“≠”,其实按照
同样的推理,这样定义一样站不住脚)。
事实上,以上定义还有更大的缺陷,就是信息集的问题。严格讲来,要真正确定因果关系,
必须考虑到完整的信息集,也就是说,要得出“A是B的原因”这样的结论,必须全面考虑宇
宙中所有的事件,否则往往就会发生误解。最明显的例子就是若另有一个事件C,它是A
和B的共同原因,考虑一个极端情况:若P(A|C)=1,P(B|C)=1,那么显然有P(B|AC)=P(B|C),
此时可以看出A事件是否发生与B事件已经没有关系了。
因此,Granger(1980)提出了因果关系的定义,他的定义是建立在完整信息集以及发生
时间先后顺序基础上的。至于判断准则,也在逐步发展变化:
最初是根据分布函数(条件分布)判断,注意Ωn是到n期为止宇宙中的所有信息,Yn为
到n期为止所有的Yt(t=1…n),Xn+1为第n+1期X的取值,Ωn-Yn为除Y之外的所有信
息。
F(Xn+1|Ωn)≠F(Xn+1|(Ωn−Yn))-------(1)
后来认为宇宙信息集是不可能找到的,于是退而求其次,找一个可获取的信息集J来替代
Ω:
F(Xn+1|Jn)≠F(Xn+1|(Jn−Yn))-------(2)
再后来,大家又认为验证分布函数是否相等实在是太复杂,于是再次退而求其次,只是验
证期望是否相等(这种叫做均值因果性,上面用分布函数验证的因果关系叫全面因果性):
E(Xn+1|Jn)≠E(Xn+1|(Jn−Yn))-------(3)
也有一种方法是验证Y的出现是否能减小对Xn+1的预测误差,即:
σ2(Xn+1|Jn)<σ2(Xn+1|(Jn−Yn))-------(4)
最后一种方法已经接近我们最常用的格兰杰因果检验方法,统计上通常用残差平方和来表
示预测误差,于是常常用X和Y建立回归方程,通过假设检验的方法(F检验)检验Y的
系数是否为零。
可以看出,我们所使用的Granger因果检验与其最初的定义已经偏离甚远,削减了很多条
件(并且由回归分析方法和F检验的使用我们可以知道还增强了若干条件),这很可能会导
致虚假的因果关系。因此,在使用这种方法时,务必检查前提条件,使其尽量能够满足。此
外,统计方法并非万能的,评判一个对象,往往需要多种角度的观察。正所谓“兼听则明,
偏听则暗”。诚然真相永远只有一个,但是也要靠科学的探索方法。
格兰杰因果关系检验的步骤(1)将当前的y对所有的滞后项y以及别的什么变量
(如果有的话)做回归,即y对y的滞后项yt-1,yt-2,…,yt-q及其他变量的回归,
但在这一回归中没有把滞后项x包括进来,这是一个受约束的回归。然后从此回归
得到受约束的残差平方和RSSR。
(2)做一个含有滞后项x的回归,即在前面的回归式中加进滞后项x,这是一个
无约束的回归,由此回归得到无约束的残差平方和RSSUR。
(3)零假设是H0:α1=α2=…=αq=0,即滞后项x不属于此回归。
(4)为了检验此假设,用F检验,即:
它遵循自由度为q和(n-k)的F分布。在这里,n是样本容量,q等于滞后项x的
个数,即有约束回归方程中待估参数的个数,k是无约束回归中待估参数的个数。
(5)如果在选定的显著性水平α上计算的F值炒股临界Fα值,则拒绝零假设,
这样滞后x项就属于此回归,表明x是y的原因。
(6)同样,为了检验y是否是x的原因,可将变量y与x相互替换,重复步骤(1)~
(5)。
格兰杰因果关系检验对于滞后期长度的选择有时很敏感。其原因可能是被检验变
量的平稳性的影响,或是样本容量的长度的影响。不同的滞后期可能会得到完全不
同的检验结果。因此,一般而言,常进行不同滞后期长度的检验,以检验模型中
随机干扰项不存在序列相关的滞后期长度来选取滞后期。
格兰杰检验的特点决定了它只能适用于时间序列数据模型的因果性检验,无法检
验只有横截面数据时变量间的因果性。
可以看出,我们所使用的Granger因果检验与其最初的定义已经偏离甚远,削减
了很多条件(并且由回归分析方法和F检验的使用我们可以知道还增强了若干条
件),这很可能会导致虚假的因果关系。因此,在使用这种方法时,务必检查前提
条件,使其尽量能够满足。此外,统计方法并非万能的,评判一个对象,往往需要
多种角度的观察。正所谓“兼听则明,偏听则暗”。诚然真相永远只有一个,但是也
要靠科学的探索方法。
值得注意的是,格兰杰因果关系检验的结论只是统计意义上的因果性,而不一定
是真正的因果关系。虽然可以作为真正的因果关系的一种支持,但不能作为肯定或
否定因果关系的最终根据。当然,即使格兰杰因果关系不等于实际因果关系,也
并不妨碍其参考价值。因为统计意义上的因果关系也是有意义的,对于经济预测等
仍然能起很大的作用。
由于假设检验的零假设是不存在因果关系,在该假设下F统计量服从F分布,因
此严格地说,该检验应该称为格兰杰非因果关系检验。