首页天道酬勤什么是面板数据什么是截面数据,eviews面板回归步骤

什么是面板数据什么是截面数据,eviews面板回归步骤

张世龙 05-12 06:36 86次浏览

根据正规步骤,面板数据模型在回归前需要检查数据的稳定性。

步骤1 :分析数据的稳定性(单位根检查) ) ) )。

根据正规步骤,面板数据模型在回归前需要检查数据的稳定性。 欢乐的咖啡豆指出,一些非常经济时间序列呈现出共同的变化趋势,这些序列之间不一定有直接的关联。 此时,回归这些数据,尽管有高的r平方,但其结果没有任何意义。 这被称为伪回归或伪回归(spurious regression )。 他认为平静的真正含义是,在一个时间序列剔除了不变的均值(可以看作截尾)和时间趋势后,剩下的序列是均值零,同向差,即白噪声。 因此,单位根检查时,有三种检查模式。 有趋势,有切片,只有切片,没有更多。

因此,为了避免伪回归,确保估计结果的有效性,需要验证各面板序列的稳定性。 检查数据稳定性的最常用方法是单位根检查。 首先,针对面板序列制作时序图,通过在大致的观测时序图中根据各观测值描绘代表变量的折线是否包含趋势项和/或截距项,可以为进一步的单位根检查的验证模式做准备。

单位根检验方法文献综述:在非稳态面板数据渐进过程中,Levin andLin(1993 )早期发现这些估计量的极限分布是简单的溪流分布,这些结果也应用于方差不同的面板数据,建立了面板单位根检验的初始版本然后,经过Levinetal.(2002 )的改良,提出了检测面板单位根的LLC法。 Levinetal.(2002 )指出,该方法允许不同切片与时间趋势、异方差和高阶序列的相关,适用于中等维度(时间序列在25~250,截面数在10~250之间)的面板单元根检测。 Im et al. (1997 )还提出了检测面板单位根的IPS法,而Breitung(2000 )发现IPS法对限定趋势的设定极为敏感,提出了检测面板单位根的Breitung法。 maddalaandWu(1999 )还提出了ADF-Fisher和PP-Fisher面板的单位根检测方法。

根据以上综述,可以采用LLC、IPS、Breintung、ADF-Fisher和PP-Fisher5种方法进行面板单元的路线检测。

其中LLC-T、BR-T、IPS-W、ADF-FCS、PP-FCS、H-Z分别指Levin,Lin Chu t*统计量、Breitung t统计量、lm Pesaran Shin W统计量、an shin w统计量PP-Fisher Chi-square统计、Hadri Z统计、以及Levin, 假设Lin Chu t*统计量、Breitung t统计量原存在普通单位根过程,lm Pesaran Shin W统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量原是有效的单位根

为了方便,针对两种面板数据单位路径检查方法、即相同的路径单位路径检查LLC(Levin-Lin-Chu )检查和不同的路径单位路径检查Fisher-ADF检查(注:通常的排列)非面板排列)的单位

如果在t (趋势)中序列包含趋势项,在I (中断)中序列包含截距项,在TI中包含两个项,而在n ) n (无)中不包含两个项,则根据从前面的时序图得出的结论,在单位路径检查中适当的检查模式

但是,根据时间图得出的结论只是粗略的,严格来说,它们的检测结构需要逐一进行检测。 具体操作可以参照高兴的咖啡豆故事。 ADF检验在三个模型上进行,首先从包含切片和趋势项的模型开始,检查只包含切片项的模型,最后检查不包含两者的模型。 并且,只有在三个模型的检测结果都不能拒绝原假设的情况下,才能认为时间序列是非平稳的;如果其中一个模型的检测结果拒绝零假设,则可以认为时间序列是平稳的。

另外,单位根检查通常从水平(level )序列开始检查,如果存在单位根,则对该序列进行一次差分继续检查,如果还存在单位根,进行二次乃至高阶差分后再进行检查,直到序列稳定为止。 依次类推I(0)是0次的单整,I )1)是1次的单整,I ) n )是n次的单整。

第二步:协调检查或模型修正

情况1 )根据单位根检验的结果,如果发现变量之间是同一次数的单一整数,就可以进行协调检验。 协整检验是考察变量之间长期均衡关系的方法。 协整是指在两个以上的非平稳变量序列的情况下,某个线性组合后的序列表现出平稳性。 此时,称为这些变量序列之间存在协调关系。 因此,协整的要求或前提是同阶段的单整。

然而,也有一种延缓理论认为,如果变量的数量多于两个,即解释变量的数量多于一个,则被解释变量的单整数阶不得高于任何解释变量的单整数阶。 如果解释变量的单整数阶高于被解释变量的单整数阶,则至少两个解释变量的单整数阶必须高于被解释变量的单整数阶。 如果只有两个解释变量,则这两个变量的单整数阶必须相同。

也就是说,如果单整次不同两个以上的非定常序列一起进行协调检查,则一定有几个低次单整的,即波动相对于高次序列的波动非常弱(例如

有可能波动幅度也不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。

协整检验方法的文献综述:(1)Kao(1999)、Kao and Chiang(2000)利用推广的DF和ADF检验提出了检验面板协整的方法,这种方法零假设是没有协整关系,并且利用静态面板回归的残差来构建统计量。(2)Pedron(1999)在零假设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao的方法不同的是,Pedroni的检验方法允许异质面板的存在。(3)Larsson et al(2001)发展了基于Johansen(1995)向量自回归的似然检验的面板协整检验方法,这种检验的方法是检验变量存在共同的协整的秩。

主要采用的是Pedroni、Kao、Johansen的方法。

通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。

这时,我们或许还想进一步对面板数据做格兰杰因果检验(因果检验的前提是变量协整)。但如果变量之间不是协整(即非同阶单整)的话,是不能进行格兰杰因果检验的,不过此时可以先对数据进行处理。引用jqddp的原话,“如果y和x不同阶,不能做格兰杰因果检验,但可通过差分序列或其他处理得到同阶单整序列,并且要看它们此时有无经济意义。”

下面简要介绍一下因果检验的含义:这里的因果关系是从统计角度而言的,即是通过概率或者分布函数的角度体现出来的:在所有其它事件的发生情况固定不变的条件下,如果一个事件X的发生与不发生对于另一个事件Y的发生的概率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事件在时间上又有先后顺序(A前B后),那么我们便可以说X是Y的原因。考虑最简单的形式,Granger检验是运用F-统计量来检验X的滞后值是否显著影响Y(在统计的意义下,且已经综合考虑了Y的滞后值;如果影响不显著,那么称X不是Y的“Granger原因”(Granger cause);如果影响显著,那么称X是Y的“Granger原因”。同样,这也可以用于检验Y是X的“原因”,检验Y的滞后值是否影响X(已经考虑了X的滞后对X自身的影响)。

Eviews好像没有在POOL窗口中提供Granger causality test,而只有unit root test和cointegration test。说明Eviews是无法对面板数据序列做格兰杰检验的,格兰杰检验只能针对序列组做。也就是说格兰杰因果检验在Eviews中是针对普通的序列对(pairwise)而言的。你如果想对面板数据中的某些合成序列做因果检验的话,不妨先导出相关序列到一个组中(POOL窗口中的Proc/Make Group),再来试试。

情况二:如果如果基于单位根检验的结果发现变量之间是非同阶单整的,即面板数据中有些序列平稳而有些序列不平稳,此时不能进行协整检验与直接对原序列进行回归。但此时也不要着急,我们可以在保持变量经济意义的前提下,对我们前面提出的模型进行修正,以消除数据不平稳对回归造成的不利影响。如差分某些序列,将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。此时的研究转向新的模型,但要保证模型具有经济意义。因此一般不要对原序列进行二阶差分,因为对变动数据或增长率数据再进行差分,我们不好对其冠以经济解释。难道你称其为变动率的变动率?

步骤三:面板模型的选择与回归

面板数据模型的选择通常有三种形式:

一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。一种是固定效应模型(Fixed Effects Regression Model)。如果对于不同的截面或不同的时间序列,模型的截距不同,则可以采用在模型中添加虚拟变量的方法估计回归参数。一种是随机效应模型(Random Effects Regression Model)。如果固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,并且这两个随机误差项都服从正态分布,则固定效应模型就变成了随机效应模型。

在面板数据模型形式的选择方法上,我们经常采用F检验决定选用混合模型还是固定效应模型,然后用Hausman检验确定应该建立随机效应模型还是固定效应模型。

检验完毕后,我们也就知道该选用哪种模型了,然后我们就开始回归:

在回归的时候,权数可以选择按截面加权(cross-section weights)的方式,对于横截面个数大于时序个数的情况更应如此,表示允许不同的截面存在异方差现象。估计方法采用PCSE(Panel Corrected Standard Errors,面板校正标准误)方法。Beck和Katz(1995)引入的PCSE估计方法是面板数据模型估计方法的一个创新,可以有效的处理复杂的面板误差结构,如同步相关,异方差,序列相关等,在样本量不够大时尤为有用。

eviews导入面板数据,eviews面板数据描述性统计