Hypothesis-Testing

使用 3 個樣本進行比例相等的假設檢驗

  • September 24, 2013

我有一個包含兩列手機客戶信息數據的數據集。第一列包含帳戶所屬的特定類別(A、B 或 C),第二列包含該帳戶是否已取消的二進制值。例如

A | cancelled
C | active
B | active
A | cancelled

我想要做的是提出某種假設檢驗來測試 A、B 和 C 類型的賬戶的比率對於活躍賬戶與取消賬戶是否不同 - 零假設是它們是相同的。所以它就像一個比例假設檢驗,除了我不知道如何對 3 個值執行此操作

我將基於我的一般回答,並就您的問題如何適合測試框架插入評論。一般來說,我們可以使用檢驗典型的零假設,, 如下:

即,所有比例彼此相等。現在,在您的情況下,您的零假設如下:

備擇假設是

現在為了執行測試我們需要計算以下測試統計量: 測試統計量的值是

在哪裡

  • = Pearson 的累積檢驗統計量,漸近接近分配
  • = 觀察到的頻率
  • = 由零假設斷言的預期(理論)頻率
  • = 表格中的單元格數

在你的情況下因為我們可以將此問題視為下表: 在此處輸入圖像描述

現在,一旦我們有了檢驗統計量,我們就有兩個選擇如何繼續完成我們的假設檢驗。

**選項1)**我們可以比較我們的測試靜態到原假設下的適當臨界值。也就是說,如果是真的,那麼一個列聯表中的統計量行和列應該有一個分佈與自由程度。計算出我們的臨界值後如果我們有那個那麼我們將拒絕原假設。顯然如果那麼我們不能拒絕原假設。

以圖形方式(所有數字都是由組成的)如下: 在此處輸入圖像描述

從圖中,如果我們的測試統計對應於藍色檢驗統計量,那麼我們將無法拒絕原假設,因為該檢驗統計量不落在臨界區域內(即,)。或者,綠色檢驗統計量確實落在關鍵區域內,因此如果我們計算了綠色檢驗統計量,我們將拒絕原假設。

在您的示例中,您的自由度等於

**選項 2)**我們可以計算與原假設下的檢驗統計量相關的 p 值,如果這個 p 值小於指定的值-level 那麼我們可以拒絕原假設。如果 p 值大於-level 那麼我們無法拒絕原假設。請注意,p 值是分佈大於檢驗統計量。

從圖形上看,我們有 在此處輸入圖像描述

其中 p 值計算為大於我們的測試統計量的區域(示例中的藍色陰影區域)。

因此,如果然後未能拒絕原假設, 別的,

如果拒絕原假設

引用自:https://stats.stackexchange.com/questions/70940

comments powered by Disqus