R

如何比較拉普拉斯分佈的 2 個均值?

  • June 19, 2015

我想比較 2 個樣本均值的 1 分鐘股票收益。我假設它們是拉普拉斯分佈的(已經檢查過),我將返回分成 2 組。如何檢查它們是否有顯著差異?

我認為我不能將它們視為正態分佈,因為即使它們的值超過 300 個,QQ 圖也表明正態分佈存在巨大差異

假設兩個拉普拉斯分佈具有相同的方差,

a) 似然比檢驗將涉及如下檢驗統計量:

取日誌,取消/簡化並乘以.

(在哪裡)

在哪裡,與組合樣本中位數的平均絕對偏差和, 與樣本中位數的平均絕對偏差.

根據威爾克斯定理,這是漸近分佈的在 null 下,所以對於 5% 的測試,如果超過了,你會拒絕.

模擬實驗表明,該測試在小樣本量下是反保守的(拒絕的概率略高於標稱值),但在 n=100 左右,它似乎至少是合理的(你得到了 5.3% - 5.4% 的數量級)例如,對於標稱 5% 測試,在 null 下的拒絕率;對於它似乎更接近 5.25%)。

b) 我們也期望將是一個很好的檢驗統計量(其中代表樣本中位數和); 如果我在那裡沒有出錯,那麼在像你這樣的大樣本中,它將大致正態分佈在零值下,均值為 0,方差為 1,其中可以基於平均絕對偏差與組合樣本中均值的平方,,儘管我希望它在實踐中往往會更好地基於兩個樣本的樣本加權平均值的 .

(編輯:模擬表明正常近似值很好,但上面的方差計算不正確;我可以看到現在的問題,但我仍然必須解決它。這個測試的​​排列版本(參見項目(c))應該仍然沒事的)。

c) 另一種選擇是根據上述任一統計數據執行置換測試。(此處的答案之一概述瞭如何針對中位數差異實施置換檢驗。)

d) 您總是可以進行 Wilcoxon/Mann-Whitney 檢驗;這將比在拉普拉斯嘗試使用 t 檢驗更有效。

e) 對於拉普拉斯數據,比 (d) 更好的是 Mood 中位數檢驗;雖然在書中經常被推薦反對,但在處理拉普拉斯數據時,它會顯示出很好的力量。我希望它與中位數差異的漸近檢驗的置換版本((c)中提到的檢驗之一)具有相似的能力。

這裡的問題給出了一個使用 Fisher 測試的 R 實現,但是該代碼可以改為使用卡方測試(我建議在中等樣本中使用);或者,這裡有它的示例代碼(不是作為函數)。

中值測試在 Wikipedia here中進行了討論,儘管沒有深入討論(鏈接的德語翻譯有更多信息)。一些關於非參數的書籍對此進行了討論。

引用自:https://stats.stackexchange.com/questions/157792

comments powered by Disqus