配對與非配對 t 檢驗
假設我有 20 隻老鼠。我以某種方式將老鼠配對,這樣我就得到了 10 對。就這個問題而言,它可能是隨機配對,也可能是明智的配對,例如嘗試將來自同一窩、同性別、體重相似的老鼠配對,或者它可能是故意愚蠢的配對,例如試圖將體重盡可能不相等的老鼠配對。然後我使用隨機數將每對中的一隻老鼠分配給對照組,另一隻老鼠分配給待治療組。我現在做實驗,只處理待處理的老鼠,其他的對剛才的安排完全不關心。
在分析結果時,可以使用非配對 t 檢驗或配對 t 檢驗。如果有的話,答案會有什麼不同?(我基本上對需要估計的任何統計參數的系統差異感興趣。)
我問這個的原因是我最近參與的一篇論文被生物學家批評為使用配對 t 檢驗而不是非配對 t 檢驗。當然,在實際實驗中,情況並不像我所描繪的那樣極端,我認為有充分的理由進行配對。但生物學家不同意。
在我看來,在我所描繪的情況下,通過使用配對 t 檢驗而不是非配對檢驗,即使配對不合適,也不可能錯誤地提高統計顯著性(降低 p 值)。然而,如果老鼠配對不當,它可能會惡化統計顯著性。這是正確的嗎?
我同意弗蘭克和彼得提出的觀點,但我認為有一個簡單的公式可以觸及問題的核心,可能值得 OP 考慮。
讓和是兩個相關性未知的隨機變量。
讓
什麼是方差?
這是一個簡單的公式:
如果(IE,和正相關)? 然後. 在這種情況下,如果由於正相關而進行配對,例如當您在干預前後處理同一主題時,配對會有所幫助,因為獨立配對差異的方差低於未配對案例的方差。該方法減少了方差。測試更強大。這可以通過循環數據顯著地顯示出來。我在一本書中看到一個例子,他們想看看華盛頓特區的溫度是否高於紐約市。因此,他們將兩個城市的平均月度溫度設為 2 年。當然,由於四個季節,一年中的差異很大。這種變化對於非配對 t 檢驗來說太大而無法檢測到差異。然而,基於同一年同一月份的配對消除了這種季節性影響,並且配對- 測試清楚地表明,華盛頓特區的平均溫度往往高於紐約。(紐約月份的溫度) 和(月內直流溫度) 是正相關的,因為紐約和華盛頓的季節是相同的,而且城市足夠近,以至於它們經常會經歷相同的影響溫度的天氣系統。DC可能會稍微暖和一些,因為它更南一些。
請注意,協方差或相關性越大,方差的減少就越大。
現在假設是負數。
然後. 現在配對會比不配對更糟糕,因為方差實際上增加了!
什麼時候和是不相關的,那麼您使用哪種方法可能並不重要。彼得的隨機配對案例就是這樣的情況。