導致原因
1:遺漏變數,且遺漏變數與引入模型的其他變數相關。
2:解釋變數和被解釋變數相互作用,相互影響,互為因果。
解決方法
工具變數估計
工具變數:假定我們有一個可觀測到的變數Z,它滿足兩個假定
(1):Z與U不相關,即與Cov(Z,U)=0;
(2):Z與X相關,即與Cov(Z,X)不等於0;
我們則稱Z是X的工具變數(instrumental variable 簡稱IV)
舉例:以雙變數模型為例
Y=Q+WX+U;
其中X與U相關,因而OLS估計有偏,現在有X的工具變數Z,
於是有Cov(Z,Y)=Cov(Z,Q+WX+U)
=Cov(Z,WX)+Cov(Z,U)(Q為常數)
=WCov(Z,X)
所以有W=Cov(Z,Y)/Cov(Z,X)
工具變數的優劣
(1):Z與U不相關,即與Cov(Z,U)=0;
相關性越低,則越好
(2):Z與X相關,即與Cov(Z,X)不等於0;
相關性越高,則越好
Z與U相關性低,Z與X相關性高,這樣的工具變數被稱為好工具變數,反之則稱為劣工具變數。
好的工具變數的識別
(1):Z與U不相關,即與Cov(Z,U)=0;
由於U無法觀察,因而難以用正式的工具進行測量,通常由經濟理論來使人們相信。
(2):Z與X相關,即與Cov(Z,X)不等於0;
將X對Z回歸即可,看看X的係數是否顯著異於零?
IV與OLS估計量的簡單比較
IV估計量:C1=Cov(Z,Y)/Cov(Z,X)
而OLS估計量是:C2=Cov(X,Y)/Cov(X,X)
(1)因此,Z=X時,兩者將完全一致,換句話說,當X外生時,它可用做自身的IV,IV估計量便等同於OLS估計量。
(2)若Z與X不相關,Cov(Z,X)等於0,則IV法無法給出估計量。
IV與OLS的取捨
(1)儘管當Z與U不相關,而Z與X存在著或正或負的相關時,IV是一致的,但當Z與X只是弱相關時IV估計值的標準誤可能很大,Z與X之間的弱相關可能產生更加嚴重的後果:即使Z與U只是適度相關,IV估計的漸進偏誤也可能很大。也即是說,當解釋變數外生時,IV與OLS估計都是一致的,但IV估計不如OLS有效。
(2)所以,當內生性程度不嚴重或者好的工具變數找不到時,還不如用OLS。反之,當內生性程度嚴重時,就一定要想辦法解決,否則,OLS估計就是不可接受的,當然,差的IV同樣是不可接受的。
其它解決辦法
(1)代理變數:某變數無法直接觀測,而用其它變數替代。
(2)前定變數:用變數的前一期或前幾期數據。
(3)面板數據模型。
檢驗
基本思想:直接比較OLS和IV估計值,若所有變數都是外生的,則OLS和IV估計都是一致的,若明顯不同,則我們就斷定解釋變數有內生性。
操作前提:首先找到一個外生變數用做工具變數。
一個問題:工具變數本身的外生性如果檢測?
對待態度
(1)需要重點考慮的問題之一;
(2)最好的收集數據之前就加以考慮,尤其是準備獲取一手數據的情況下。如果考慮?套用經濟理論。