Regression

自舉回歸分析後,所有 p 值都是 0.001996 的倍數

  • September 20, 2020

我在 SPSS 27 中運行各種多元回歸分析,對於那些沒有自舉的分析,p 值會發生變化,以至於我在回歸中找不到兩次相同的 p 值(例如,p 值將是 0.000012435 、0.0053868、0.000000013845 等)。但是,我引導了其中一些回歸(bca,500 個樣本),並且表下列出的所有 p 值表明引導結果是 0.001996 的倍數(例如,0.001996、0.003992、0.007984)。這些是合法的 p 值嗎?或者這是 SPSS 的一個錯誤?無論哪種情況,這些 p 值是“可報告的”,還是應該使用非自舉回歸結果的 p 值?

假設您的回歸係數估計值為 1.2。要計算其 p 值,您需要知道在原假設下觀察到如此大(或更大)的係數的概率。為此,您必須知道該係數的零分佈。自舉重採樣是估計這種零分佈的一種方法。對於回歸,在您的 500 個引導樣本中,您將獲得回歸係數的分佈,其均值接近 1.2。假設自舉採樣係數的平均值為 1.19。假設您的零假設是係數的真實值為 0。這意味著該係數的零分佈的平均值應為 0。我們可以通過簡單地使 500 個自舉採樣係數的平均值為 0減去他們當前的平均值 1.19。

然後,要計算(雙尾)p 值,我們可以簡單地計算 500 個偏移係數的絕對值大於觀測值 1.2 的比例。例如,如果其中 6 個更大,則 p 值為 6/500 = 0.012。請注意,我們以這種方式計算的任何 p 值將始終是某個整數除以 500。因此,可以從該計算得出的唯一 p 值是 0.002 的整數倍的值,即 1/500。

你得到的值不是 0.002 的倍數,而是 0.001996 的倍數。結果幾乎完全等於 1/501。這種差異為 1 的原因是,從 bootstrap 計算的“常規”p 值存在偏差。常規公式是 $ \hat{p}=\frac{x}{N} $ , 在哪裡 $ x $ 是大於觀察值的自舉採樣係數的數量,以及 $ N $ 是引導樣本的數量。偏差校正公式為 $ \hat{p}=\frac{x+1}{N+1} $ . 因此,由該公式得出的任何 p 值都將是 $ \frac{1}{N+1} $ ,在你的情況下是 1/501。

引用自:https://stats.stackexchange.com/questions/488356

comments powered by Disqus