d 具有 100% 命中率概率和 0% 誤報概率的素數
我想為涉及檢測新舊項目的記憶任務計算**d prime 。**我遇到的問題是一些受試者的命中率為 1 和/或誤報率為 0,這使得概率分別為 100% 和 0%。
d prime的公式是
d' = z(H) - z(F)
,其中z(H)
和z(F)
分別是命中率和誤報率的 z 變換。為了計算 z 變換,我使用 Excel 函數NORMSINV(即
z(H)=NORMSINV(hit rate)
)。但是,如果命中率或誤報率分別為 1 或 0,則該函數將返回錯誤。這是因為據我所知, z transform 表示 ROC 曲線下的區域,這在數學上不允許 100% 或 0% 的概率。在這種情況下,我不確定如何為具有最高表現的科目計算 d'。一個網站建議用 1 - 1/(2N) 和 1/2N 替換 1 和 0 率,其中 N 是命中和誤報的最大數量。另一個網站說“H 和 F 都不能是 0 或 1(如果是,請稍微向上或向下調整)”。這似乎是任意的。有沒有人對此有意見或想向我指出正確的資源?
Stanislaw & Todorov (1999)在“ Hit and False-Alarm Rates of Zero or One ”的標題下對此進行了很好的討論。
他們討論了處理這些極端值的幾種方法的優缺點,包括:
- 使用非參數統計,例如 $ A' $ 代替 $ d' $ (克雷格,1979)
- 在計算統計數據之前匯總來自多個受試者的數據 (Macmillan & Kaplan, 1985)
- 命中次數和誤報次數加 0.5,信號試驗次數和噪聲試驗次數加 1;被稱為對數線性方法(Hautus,1995)(見下面的註釋)
- 通過將 0 的比率替換為 $ 0.5/n $ 和 1 的利率 $ (n-0.5)/n $ 在哪裡 $ n $ 是信號或噪聲試驗的次數 (Macmillan & Kaplan, 1985)
選擇最終取決於您。我個人更喜歡第三種方法。第一種方法的缺點是 $ A' $ 對更熟悉的讀者來說不太容易理解 $ d' $ . 如果您對單一主題的行為感興趣,則第二種方法可能不適合。第四種方法是有偏見的,因為您沒有平等地對待數據點。
注意:在假設信號和噪聲試驗次數相等的情況下,對數線性方法要求向所有單元添加 0.5。如果不是這種情況,那麼數字將有所不同。例如,如果有 60% 的信號試驗和 40% 的噪聲試驗,那麼您將在 Hits 的數量上加上 0.6,在信號試驗的數量上加上 2x0.6 = 1.2,然後在誤報的數量上加上 0.4,和 2x0.4 = 0.8 噪聲試驗次數等。