Hypothesis-Testing

如何在 10 分鐘內解釋青少年的假設檢驗?

  • February 8, 2015

一年多以來,我一直在上一小時的“統計學品味”課。每次我有一群不同的孩子過來,我給他們上課。

這堂課的主題是我們進行了一個實驗,給 10 個孩子(喜歡喝可口可樂)兩個(沒有標記的)杯子,一個是可口可樂,一個是百事可樂。孩子們被要求根據味道和氣味來檢測哪個杯子裡有可口可樂飲料。

然後我需要向他們解釋如何確定孩子們是否在猜測,或者他們(或至少,足夠多的人)是否真的有能力品嚐差異。10次​​成功中有10次足夠好嗎?10個中有7個呢?

即使在給這門課上了幾十次(不同的變體)之後,我仍然覺得我不知道如何以大多數班級都能理解的方式傳達這個概念。

如果您對如何以簡單(!)和直觀的方式解釋假設檢驗、零假設、替代假設、拒絕區域等的概念有任何想法- 我很想知道如何。

我認為你應該首先問他們,他們認為對一個人說他或她能夠區分可口可樂和百事可樂的真正含義是什麼。這樣的人能做什麼別人做不到的事?

他們中的大多數人不會有任何這樣的定義,如果被問到,他們也無法做出這樣的定義。然而,這句話的含義是統計給我們的,這就是你可以通過“統計品味”課程帶來的東西。

統計的要點之一是對這個問題給出一個準確的答案:“說某人能夠區分可口可樂和百事可樂是什麼意思”

答案是:在盲測中,他或她比猜謎機更能對杯子進行分類。猜謎機無法區分,它只是一直在猜測。猜謎機對我們來說是一項有用的發明,因為我們知道它沒有這個能力。猜測機的結果很有用,因為它們顯示了我們應該從缺乏我們測試的能力的人身上得到什麼。

要測試一個人是否能夠區分可口可樂和百事可樂,必須將他或她在盲測中對杯子的分類與猜謎機的分類進行比較。只有當她/他比猜謎機更好時,她/他才能分辨出其中的差別。

那麼,您如何確定一個結果是否優於另一個結果?如果它們幾乎相同怎麼辦?

如果兩個人對少量杯子進行分類,如果結果幾乎相同,說一個比另一個好是不公平的。或許今天的勝者只是碰巧運氣好,如果明天再重賽,結果就會逆轉?

如果我們要得到一個值得信賴的結果,它不能基於少數分類,因為機會可以決定結果。請記住,您不必完美才能擁有能力,您只需比猜謎機更好。事實上,如果分類的數量太少,即使是一個總是能正確識別可口可樂的人,也無法證明他/她比猜謎機好。例如,如果只有一個杯子要分類,即使是猜謎機也有 50% 的機會分類完全正確。這不好,因為這意味著在 50% 的試驗中,我們會錯誤地得出結論,即一個好的可口可樂標識符並不比猜測機好。很不公平。

待分類的杯子越多,猜謎機被揭穿的機會就越多,好可口可樂標識的炫耀機會也就越多。

10 杯可能是一個不錯的起點。一個人必須有多少正確答案才能證明他或她比機器更好?

問他們會猜到什麼。

然後讓他們使用機器並找出它有多好,即讓所有學生產生一系列十個猜測,例如。在智能手機上使用骰子或隨機發生器。為了教學,你應該準備一系列的十個正確答案,用來評估猜測。

在黑板上記錄所有結果。在黑板上打印排序結果。解釋說,在統計學家承認他或她有能力區分可口可樂和百事可樂之前,人類必須優於這些結果的 95%。畫一條線,將 95% 的最差結果與前 5% 的結果分開。

然後,讓幾個學生嘗試對 10 個杯子進行分類。到現在為止,學生應該知道他們需要多少正確才能證明他們能分辨出不同。

不過,這一切在 10 分鐘內並不是真正可行的。

引用自:https://stats.stackexchange.com/questions/136831

comments powered by Disqus