Quantile-Regression

條件分位數回歸和無條件分位數回歸有什麼區別?

  • December 22, 2013

Koenker 和 Basset (1978) 的條件分位數回歸估計器分位數定義為

在哪裡是殘差的重新加權函數(稱為“檢查”函數). 在Firpo 等人的論文中。(2009 年),作者指出條件分位數回歸不會產生有趣的效果。他們說條件結果不能推廣到總體(在 OLS 中,我們總是可以通過迭代期望定律從有條件變為無條件,但這不適用於分位數)。這是因為無條件分位數可能不一樣條件分位數.

如果我理解正確,部分問題是哪些協變量包含在對排名變量有影響因為包含協變量會將誤差分為觀察到的和未觀察到的分量。我只是不太明白為什麼這會導致問題。

以下是我的問題:

  1. 是什麼讓有條件和無條件分位數效應彼此不同?
  2. 如何解釋條件分位數回歸的係數?
  3. 條件分位數回歸是否有偏差?

參考:

  • Koenker, R., & Bassett, G. (1978) “回歸分位數”,計量經濟學,卷。46(1),第 33-50 頁。
  • Firpo, S. 等人。(2009) “無條件分位數回歸”,計量經濟學,卷。77(3),第 953-973 頁。

設置

假設你有一個簡單的表格回歸

結果是人的對數收入,是受教育年限,並且是一個錯誤術語。您不僅要查看通過 OLS 獲得的教育對收入的平均影響,還希望查看結果分佈的不同部分的影響。 1)有條件設置和無條件設置有什麼區別

首先繪製對數收益,讓我們選擇兩個人,和, 在哪裡處於無條件收益分配的下部,並且位於上部。 在此處輸入圖像描述

它看起來不太正常,但那是因為我在模擬中只使用了 200 個觀察值,所以不要介意。現在,如果我們以受教育年限為條件,會發生什麼?對於每個教育級別,您將獲得一個“有條件的”收入分配,即您將得出一個如上所述的密度圖,但每個教育級別是分開的。

在此處輸入圖像描述

兩條深藍色線是中位數(下線)和第 90 個百分位數(上線)的線性分位數回歸的預測收益。5 年和 15 年教育的紅色密度為您提供了條件收入分配的估計值。如你所見,個人有5年的教育和個人有15年的教育。顯然,個人在 5 年的教育階段,在他的梨中表現相當不錯,因此她在第 90 個百分位。

因此,一旦您以另一個變量為條件,現在已經發生了一個人現在處於條件分佈的頂部,而該人將處於無條件分佈的下部 - 這就是改變分位數回歸係數解釋的原因. 為什麼?

您已經說過,使用 OLS 我們可以從然而,通過應用迭代期望定律,這是期望運算符的一個屬性,它不適用於分位數(不幸的是!)。因此一般來說, 在任何分位數. 這可以通過首先執行條件分位數回歸然後整合條件變量來解決,以獲得可以解釋為 OLS 的邊緣化效應(無條件效應)。Powell (2014)提供了這種方法的一個示例。

2)如何解釋分位數回歸係數?

這是棘手的部分,我並沒有聲稱擁有世界上所有關於這方面的知識,所以也許有人對此提出了更好的解釋。如您所見,無論您考慮有條件分配還是無條件分配,個人在收益分配中的排名可能會非常不同。

對於條件分位數回歸

由於您無法判斷個體在治療前後在結果分佈中的位置,因此您只能對整個分佈進行陳述。例如,在上面的例子中意味著額外一年的教育會增加有條件收入分配的第 90 個百分位數的收入(但在分配給人們額外一年的教育之前,您不知道誰仍在該分位數中)。這就是為什麼條件分位數估計或條件分位數處理效果通常不被認為是“有趣的”。通常我們想知道治療如何影響我們手頭的個人,而不僅僅是分佈。

對於無條件分位數回歸

這些就像您用來解釋的 OLS 係數。這裡的困難不是解釋,而是如何獲得那些並不總是容易的係數(積分可能不起作用,例如,對於非常稀疏的數據)。可以使用其他邊緣化分位數回歸係數的方法,例如 Firpo (2009) 使用中心化影響函數的方法。Angrist 和 Pischke(2009 年)在評論中提到的書指出,分位數回歸係數的邊緣化仍然是計量經濟學中一個活躍的研究領域——儘管據我所知,現在大多數人都接受積分方法(一個例子是Melly 和 Santangelo (2015)將其應用於 Changes-in-Changes 模型)。

3)條件分位數回歸係數是否有偏差? 不(假設您有一個正確指定的模型),它們只是測量您可能感興趣或可能不感興趣的不同事物。正如我所說,估計對分佈而不是個人的影響不是很有趣 - 大多數時候。舉一個反例:考慮一個政策制定者,他引入了額外的一年義務教育,他們想知道這是否會減少人口中的收入不平等。

前兩個面板顯示了一個純粹的位置偏移,其中在所有分位數處都是一個常數,即一個常數分位數處理效果,這意味著如果,額外一年的教育會使整個收入分配的收入增加 8%。

當分位數處理效果不是恆定的(如底部兩個面板中)時,除了位置效果外,您還具有比例效果。在這個例子中,收入分佈的底部向上移動的幅度大於頂部,因此人口中 90-10 的差異(收入不平等的標準衡量標準)減少了。 在此處輸入圖像描述

您不知道哪些人從中受益,也不知道從底部開始的人在分佈的哪個部分(要回答這個問題,您需要無條件的分位數回歸係數)。也許這項政策會傷害他們並使他們相對於其他人處於更低的位置,但如果目的是了解額外一年的義務教育是否會減少收入分佈,那麼這將是有益的。這種方法的一個例子是Brunello 等人。(2009 年)

如果您仍然對內生性來源導致的分位數回歸偏差感興趣,請查看Angrist 等人 (2006),他們在其中推導出了分位數上下文的省略變量偏差公式。

引用自:https://stats.stackexchange.com/questions/80349

comments powered by Disqus

相關問答