Hypothesis-Testing

結合應用於相同數據的不同統計測試的 p 值

  • November 15, 2013

儘管問題的標題看起來微不足道,但我想解釋一下,它與在類似數據集中應用相同統計測試以測試完全零假設的問題不同(薈萃分析,例如使用 Fisher 的方法來組合 p 值)。我正在尋找的是一種方法(如果它存在並且問題在統計術語中是否有效),它將結合來自兩個不同統計測試(例如 t 測試和 u 測試,即使一個是參數,另一個不是),用於比較來自兩個總體的兩個樣本的中心。到目前為止,我在網上搜索了很多,沒有一個明確的答案。我能找到的最佳答案是基於 David Bickel ( http://arxiv.org/pdf/1111.6174.pdf ) 的博弈論概念。

一個非常簡單的解決方案是投票方案。假設我有兩個觀察向量和並且我想應用幾個類似 t 的統計數據(t 檢驗、u 檢驗,甚至 1-way ANOVA)來檢驗兩個基本分佈的中心(均值、中位數等)與以下假設相等的假設:它們不是,顯著性水平為 0.05。假設我運行 5 個測試。如果我在 5 次測試中有 3 次的 p 值 < 0.05,那麼說有足夠的證據拒絕零分佈是否合理?

另一種解決方案是使用總概率定律還是完全錯誤的?例如,假設是拒絕零分佈的事件。然後,使用 3 個測試,,,(意思是),可能的值為是, 在哪裡是在測試下拒絕零分佈的概率.

如果答案很明顯或問題太愚蠢,我深表歉意

使用 Corone 提倡的多重測試校正是可以的,但它會花費你大量的力量,因為你的 p 值通常會很好地相關,即使使用 Hommel 校正也是如此。

有一種解決方案對計算要求很高,但在功率方面會做得更好。如果是你的 p 值,讓. 考慮到是你的新檢驗統計量:它越小,它就越反對零假設。

你需要計算- 觀察值的值(稱它為)。為此,您可以在零假設下模擬 100 000 個數據集,並且對於每個這樣的數據集,計算一個. 這給你一個經驗分佈在原假設下。您的-value 是模擬值的比例.

你如何模擬零假設下的數據集?在你的情況下,如果我猜得好的話,你有案例和對照,以及 RNS-seq 數據來估計表達水平。為了模擬空值下的數據集,習慣上只是簡單地隨機排列病例/對照狀態。

引用自:https://stats.stackexchange.com/questions/76643

comments powered by Disqus