Hypothesis-Testing

雙尾測試……我只是不相信。重點是什麼?

  • May 23, 2018

以下摘自條目,單尾測試和雙尾測試有什麼區別?,在 UCLA 的統計幫助網站上。

…考慮在另一個方向上錯過效果的後果。想像一下,您開發了一種您認為是對現有藥物的改進的新藥。您希望最大限度地提高檢測改進的能力,因此您選擇單尾測試。在這樣做時,您無法測試新藥是否不如現有藥物有效。

在學習了假設檢驗的絕對基礎知識並進入關於一對二尾檢驗的部分之後……我了解了一個尾檢驗的基本數學和增加的檢測能力等……但我就是無法理解圍繞一件事……有什麼意義?我真的不明白為什麼當你的樣本結果只能是一個或另一個,或者兩者都不是時,你為什麼應該在兩個極端之間分割你的 alpha。

從上面引用的文本中獲取示例場景。對於相反方向的結果,您怎麼可能“測試失敗”?你有你的樣本平均值。你有你的人口平均數。簡單的算術告訴你哪個更高。在相反的方向有什麼可以測試或無法測試的?如果您清楚地看到樣本均值偏離了另一個方向,那麼是什麼阻止您從頭開始提出相反的假設?

來自同一頁面的另一個引用:

在運行未能拒絕原假設的雙尾檢驗後選擇單尾檢驗是不合適的,無論雙尾檢驗有多“接近”顯著性。

我認為這也適用於切換單尾測試的極性。但是,如果您一開始只是選擇了正確的單尾測試,那麼這個“篡改過的”結果怎麼會更不有效呢?

顯然,我在這裡遺漏了大部分圖片。這一切似乎太武斷了。我想,從某種意義上說,什麼是“統計顯著”——95%、99%、99.9%……一開始是任意的。

把數據想像成冰山一角——你在水面上所能看到的只是冰山一角,但實際上你有興趣了解整個冰山的一些知識。

統計學家、數據科學家和其他處理數據的人都小心翼翼,不要讓他們在水線以上看到的東西影響和偏向他們對水線以下隱藏內容的評估。出於這個原因,在假設檢驗的情況下,他們傾向於在看到冰山一角之前製定他們的零假設和替代假設,基於他們對如果能看到整個冰山可能會發生什麼的預期(或缺乏預期) .

查看數據來製定假設是一種糟糕的做法,應該避免——這就像本末倒置。回想一下,數據來自從目標人群/感興趣的宇宙中選擇的單個樣本(希望使用隨機選擇機制)。樣本有自己的特質,可能反映也可能不反映潛在人群。為什麼您希望您的假設反映人口的一小部分而不是整個人口?

另一種思考方式是,每次從目標人群中選擇樣本(使用隨機選擇機制)時,樣本都會產生不同的數據。如果您使用數據(您不應該使用數據!!!)來指導您對零假設和替代假設的規範,那麼您的假設將無處不在,主要由每個樣本的特殊特徵驅動。當然,在實踐中我們只抽取一個樣本,但如果其他人使用相同大小的不同樣本進行相同的研究,他們將不得不改變他們的假設以反映現實,這將是一個非常令人不安的想法。他們的樣本。

我的一位研究生院教授曾經有一句非常明智的說法:“我們不關心樣本,只是它告訴我們關於人口的一些信息”。我們想制定我們的假設來了解目標人群,而不是我們碰巧從該人群中選擇的一個樣本。

引用自:https://stats.stackexchange.com/questions/347727

comments powered by Disqus