d 具有 100% 命中率概率和 0% 誤報概率的素數

January 24, 2015

我想為涉及檢測新舊項目的記憶任務計算**d prime 。**我遇到的問題是一些受試者的命中率為 1 和/或誤報率為 0，這使得概率分別為 100% 和 0%。

d prime的公式是d' = z(H) - z(F)，其中z(H)和z(F)分別是命中率和誤報率的 z 變換。

為了計算 z 變換，我使用 Excel 函數NORMSINV（即z(H)=NORMSINV(hit rate)）。但是，如果命中率或誤報率分別為 1 或 0，則該函數將返回錯誤。這是因為據我所知， z transform 表示 ROC 曲線下的區域，這在數學上不允許 100% 或 0% 的概率。在這種情況下，我不確定如何為具有最高表現的科目計算 d'。

一個網站建議用 1 - 1/(2N) 和 1/2N 替換 1 和 0 率，其中 N 是命中和誤報的最大數量。另一個網站說“H 和 F 都不能是 0 或 1（如果是，請稍微向上或向下調整）”。這似乎是任意的。有沒有人對此有意見或想向我指出正確的資源？

Stanislaw & Todorov (1999)在“ Hit and False-Alarm Rates of Zero or One ”的標題下對此進行了很好的討論。

他們討論了處理這些極端值的幾種方法的優缺點，包括：

使用非參數統計，例如 $ A' $ 代替 $ d' $ （克雷格，1979）

在計算統計數據之前匯總來自多個受試者的數據 (Macmillan & Kaplan, 1985)

命中次數和誤報次數加 0.5，信號試驗次數和噪聲試驗次數加 1；被稱為對數線性方法（Hautus，1995）（見下面的註釋）

通過將 0 的比率替換為 $ 0.5/n $ 和 1 的利率 $ (n-0.5)/n $ 在哪裡 $ n $ 是信號或噪聲試驗的次數 (Macmillan & Kaplan, 1985)

選擇最終取決於您。我個人更喜歡第三種方法。第一種方法的缺點是 $ A' $ 對更熟悉的讀者來說不太容易理解 $ d' $ . 如果您對單一主題的行為感興趣，則第二種方法可能不適合。第四種方法是有偏見的，因為您沒有平等地對待數據點。

注意：在假設信號和噪聲試驗次數相等的情況下，對數線性方法要求向所有單元添加 0.5。如果不是這種情況，那麼數字將有所不同。例如，如果有 60% 的信號試驗和 40% 的噪聲試驗，那麼您將在 Hits 的數量上加上 0.6，在信號試驗的數量上加上 2x0.6 = 1.2，然後在誤報的數量上加上 0.4，和 2x0.4 = 0.8 噪聲試驗次數等。

引用自：https://stats.stackexchange.com/questions/134779

comments powered by Disqus

d 具有 100% 命中率概率和 0% 誤報概率的素數

相關問答

這個帶有兩個連接點的行的圖的名稱是什麼？

怎麼能R2R2R^2對於相同的回歸有兩個不同的值（沒有截距）[重複]

與 PowerPoint 一起使用的最佳開源數據可視化軟件

在 Excel 與 R 中計算卡方的奇怪方法

從 t 分佈生成隨機數

如何將頻率表轉換為值向量？