Hypothesis-Testing
“所有這些數據點都來自同一個分佈。”如何測試?
我覺得我以前在這裡討論過這個話題,但我找不到任何具體的東西。再說一次,我也不確定要搜索什麼。
我有一組一維有序數據。我假設集合中的所有點都來自相同的分佈。
我怎樣才能檢驗這個假設?針對“該數據集中的觀察來自兩個不同的分佈”的一般替代方法進行測試是否合理?
理想情況下,我想確定哪些點來自“其他”分佈。由於我的數據是有序的,在以某種方式測試切割數據是否“有效”之後,我可以確定一個切割點嗎?
編輯:根據 Glen_b 的回答,我會對嚴格積極的單峰分佈感興趣。我也對假設分佈然後測試不同參數的特殊情況感興趣。
想像兩個場景:
- 數據點都來自相同的分佈——在 (16,36) 上是一致的
- 數據點來自兩個群體的 50-50 組合:
一個。人口 A,其形狀如下:
灣。人口 B,形狀如下:
…使得兩者的混合看起來與 1 中的情況完全相同。
怎麼能分得清呢?
無論您為兩個種群選擇何種形狀,總會有一個形狀相同的種群分佈。這個論點清楚地表明,對於一般情況,你根本做不到。沒有辦法區分。
如果您介紹有關人口的信息(假設,有效地),那麼通常可能有繼續進行的方法*,但一般情況下是死的。
- 例如,如果您假設人口是單峰的並且具有足夠不同的意味著您可以到達某個地方
[添加到問題中的限制不足以避免我上面描述的那種問題的不同版本——我們仍然可以在正半線上寫一個單峰空值作為兩個單峰分佈的 50-50 混合在正半線上。當然,如果您有更具體的空值,這將不再是一個問題。或者,在我們能夠針對某些混合替代品進行測試之前,應該仍然可以進一步限制替代品的類別。或者一些額外的限制可能適用於 null 和 Alternative,這將使它們可以區分。]