Hypothesis-Testing

這和和z-測試與χ2χ2chi^2- 比較兩組感冒機率的測試

  • January 12, 2014

我剛剛在一本頗受尊敬的(流行的)科學雜誌(德國總理,02/2013,第 36 頁)中讀到了一個有趣的實驗(不幸的是,沒有來源)。它引起了我的注意,因為直覺上我懷疑結果的重要性,但提供的信息足以重現統計測試。

研究人員想知道在寒冷的天氣中變冷是否會增加患感冒的機率。所以他們隨機將一組 180 名學生分成兩組。一組必須將腳浸入冷水中 20 分鐘。另一個人繼續穿鞋。我認為這是一種有趣的操作,但另一方面,我不是醫生,也許醫生認為這很有趣。除了道德問題。

無論如何,5天后,治療組有13名學生感冒了,但穿著鞋子的組中只有5人。因此,該實驗的優勢比為 2.87。

鑑於樣本量相當小,我開始懷疑這種差異是否很大。所以我進行了兩次測試。

首先使用正態近似對比例相等進行簡單測試。這個測試有和. 我的猜測是,這是研究人員測試的。這真的很重要。但是,如果我沒記錯的話,由於正態近似,這個 z 檢驗僅在大樣本中有效。此外,患病率相當小,我想知道這是否不會影響效果置信區間的覆蓋率。

所以我的第二次嘗試是獨立性的卡方檢驗,包括蒙特卡洛模擬和標準皮爾遜卡方檢驗。在這裡我發現p值都關於.

現在這一切都不是那麼令人放心的結果。我想知道是否有更多選項來測試這些數據以及您對這兩個測試的想法是什麼(特別是第一個重要測試的假設)

我會使用置換檢驗而不是正態近似或卡方。置換檢驗是精確且最強大的,以數據為條件。

在這種情況下,我們無法計算組的所有排列,但我們可以生成大量數據的隨機排列並得到一個非常精確的值:

group <- c(rep("A",90),rep("B",90))
n_a <- rep(0,100000)
for (i in 1:length(n_a)) {
  temp <- sample(group, size=18)
  n_a[i] <- sum(temp == "A")
}
> mean(n_a >= 13)
[1] 0.03904

這表明 p 值為 0.039。

然而,這是一個很大的問題,但我猜想,感冒的受試者是獨立事件的假設被違反了。這些人是學生,大概在同一所學校。想像他們中的兩個人共享一個班級、一個宿舍、或其他一些活動、或一個自助餐廳(在一所擁有多個自助餐廳的學校中);事件“#1 感冒了”和“#2 感冒了”不是獨立的。我可以想像一個學生會說“讓我們報名參加這個實驗!” 給他/她的室友或朋友;我可以想像學生是從教授教授的課程中招募的;我可以想像很多違反獨立假設的方式。也許這篇我沒有讀過的論文解決了其中一些問題,但很難看出它如何解決所有這些問題,

引用自:https://stats.stackexchange.com/questions/81975

comments powered by Disqus