自舉回歸分析後，所有 p 值都是 0.001996 的倍數

September 20, 2020

我在 SPSS 27 中運行各種多元回歸分析，對於那些沒有自舉的分析，p 值會發生變化，以至於我在回歸中找不到兩次相同的 p 值（例如，p 值將是 0.000012435 、0.0053868、0.000000013845 等）。但是，我引導了其中一些回歸（bca，500 個樣本），並且表下列出的所有 p 值表明引導結果是 0.001996 的倍數（例如，0.001996、0.003992、0.007984）。這些是合法的 p 值嗎？或者這是 SPSS 的一個錯誤？無論哪種情況，這些 p 值是“可報告的”，還是應該使用非自舉回歸結果的 p 值？

假設您的回歸係數估計值為 1.2。要計算其 p 值，您需要知道在原假設下觀察到如此大（或更大）的係數的概率。為此，您必須知道該係數的零分佈。自舉重採樣是估計這種零分佈的一種方法。對於回歸，在您的 500 個引導樣本中，您將獲得回歸係數的分佈，其均值接近 1.2。假設自舉採樣係數的平均值為 1.19。假設您的零假設是係數的真實值為 0。這意味著該係數的零分佈的平均值應為 0。我們可以通過簡單地使 500 個自舉採樣係數的平均值為 0減去他們當前的平均值 1.19。

然後，要計算（雙尾）p 值，我們可以簡單地計算 500 個偏移係數的絕對值大於觀測值 1.2 的比例。例如，如果其中 6 個更大，則 p 值為 6/500 = 0.012。請注意，我們以這種方式計算的任何 p 值將始終是某個整數除以 500。因此，可以從該計算得出的唯一 p 值是 0.002 的整數倍的值，即 1/500。

你得到的值不是 0.002 的倍數，而是 0.001996 的倍數。結果幾乎完全等於 1/501。這種差異為 1 的原因是，從 bootstrap 計算的“常規”p 值存在偏差。常規公式是 $ \hat{p}=\frac{x}{N} $ ，在哪裡 $ x $ 是大於觀察值的自舉採樣係數的數量，以及 $ N $ 是引導樣本的數量。偏差校正公式為 $ \hat{p}=\frac{x+1}{N+1} $ . 因此，由該公式得出的任何 p 值都將是 $ \frac{1}{N+1} $ ，在你的情況下是 1/501。

引用自：https://stats.stackexchange.com/questions/488356

comments powered by Disqus

自舉回歸分析後，所有 p 值都是 0.001996 的倍數

相關問答

關於文章“拋棄 p 值。改用 Bootstrap 置信區間”的三個問題

我可以比較 p 值嗎？

為什麼當平均值看起來真的不同時，t.test() 的 p 值在統計上不顯著

隨機森林是否擅長檢測交互項？

為什麼均值 ± 2*SEM（95% 置信區間）重疊，但 p 值為 0.05？

為什麼不以以下方式進行引導？