Roc

d 具有 100% 命中率概率和 0% 誤報概率的素數

  • January 24, 2015

我想為涉及檢測新舊項目的記憶任務計算**d prime 。**我遇到的問題是一些受試者的命中率為 1 和/或誤報率為 0,這使得概率分別為 100% 和 0%。

d prime的公式是d' = z(H) - z(F),其中z(H)z(F)分別是命中率和誤報率的 z 變換。

為了計算 z 變換,我使用 Excel 函數NORMSINV(即z(H)=NORMSINV(hit rate))。但是,如果命中率或誤報率分別為 1 或 0,則該函數將返回錯誤。這是因為據我所知, z transform 表示 ROC 曲線下的區域,這在數學上不允許 100% 或 0% 的概率。在這種情況下,我不確定如何為具有最高表現的科目計算 d'。

一個網站建議用 1 - 1/(2N) 和 1/2N 替換 1 和 0 率,其中 N 是命中和誤報的最大數量。另一個網站說“H 和 F 都不能是 0 或 1(如果是,請稍微向上或向下調整)”。這似乎是任意的。有沒有人對此有意見或想向我指出正確的資源?

Stanislaw & Todorov (1999)在“ Hit and False-Alarm Rates of Zero or One ”的標題下對此進行了很好的討論。

他們討論了處理這些極端值的幾種方法的優缺點,包括:

  • 使用非參數統計,例如 $ A' $ 代替 $ d' $ (克雷格,1979)
  • 在計算統計數據之前匯總來自多個受試者的數據 (Macmillan & Kaplan, 1985)
  • 命中次數和誤報次數加 0.5,信號試驗次數和噪聲試驗次數加 1;被稱為對數線性方法(Hautus,1995)(見下面的註釋
  • 通過將 0 的比率替換為 $ 0.5/n $ 和 1 的利率 $ (n-0.5)/n $ 在哪裡 $ n $ 是信號或噪聲試驗的次數 (Macmillan & Kaplan, 1985)

選擇最終取決於您。我個人更喜歡第三種方法。第一種方法的缺點是 $ A' $ 對更熟悉的讀者來說不太容易理解 $ d' $ . 如果您對單一主題的行為感興趣,則第二種方法可能不適合。第四種方法是有偏見的,因為您沒有平等地對待數據點。

注意:在假設信號和噪聲試驗次數相等的情況下,對數線性方法要求向所有單元添加 0.5。如果不是這種情況,那麼數字將有所不同。例如,如果有 60% 的信號試驗和 40% 的噪聲試驗,那麼您將在 Hits 的數量上加上 0.6,在信號試驗的數量上加上 2x0.6 = 1.2,然後在誤報的數量上加上 0.4,和 2x0.4 = 0.8 噪聲試驗次數等。

引用自:https://stats.stackexchange.com/questions/134779

comments powered by Disqus