Hypothesis-Testing
關於費舍爾的精確檢驗:如果這位女士不知道先喝牛奶的杯數,什麼樣的檢驗才是合適的?
在 RA Fisher 著名的女士品茶實驗中,這位女士被告知有多少個牛奶優先/茶優先的杯子(8 個杯子中的每個杯子有 4 個)。這尊重了 Fisher 精確檢驗的固定邊際總假設。
我想和我的朋友一起做這個測試,但這個想法讓我印象深刻。如果這位女士真的能區分牛奶優先和茶優先杯子之間的區別,她應該能夠計算出牛奶優先/茶優先杯子的邊際總數以及哪些是哪些。
那麼問題來了:如果 RA Fisher 沒有告知女士先喝牛奶和先喝茶的杯子的總數,可以使用什麼測試?
有人會爭辯說,即使第二個邊距不是設計固定的,它也很少包含關於女士辨別能力的信息(即它大約是輔助性的)並且應該以它為條件。精確的無條件檢驗(由Barnard首次提出)更為複雜,因為您必須計算一個有害參數的所有可能值的最大 p 值,即原假設下的常見伯努利概率。最近,有人提出在置信區間內最大化有害參數的 p 值:參見 Berger (1996),“來自置信區間 p 值的更強大的檢驗”,美國統計學家,50、4;使用這個想法可以構建具有正確大小的精確測試。
在 Edgington 的意義上,Fisher 精確檢驗也作為隨機化檢驗出現:實驗處理的隨機分配允許檢驗統計量在這些分配的排列上的分佈用於檢驗零假設。在這種方法中,女士的決定被認為是固定的(牛奶優先和茶優先杯子的邊際總數當然通過排列保留)。