Terminology
描述性統計和推論性統計有什麼區別?
我的理解是,描述性統計定量地描述了數據樣本的特徵,而推論統計量對抽取樣本的人群進行了推斷。
但是,統計推斷的維基百科頁面指出:
在大多數情況下,統計推斷使用通過某種形式的隨機抽樣從感興趣的人口中提取的數據來提出關於人口的命題。
“大部分”讓我覺得我可能沒有正確理解這些概念。有沒有不提出關於人口命題的推論統計的例子?
來自行為科學背景,我特別將這個術語與介紹性統計教科書聯繫起來。在這種情況下,區別在於:
- 描述性統計 是樣本數據的函數,它們在描述數據的某些特徵方面具有內在意義。經典的描述性統計包括均值、最小值、最大值、標準差、中值、偏斜、峰度。
- 推論統計是樣本數據的函數,可幫助您就總體參數的假設進行推斷。經典的推論統計包括 z、t、, F 比等。
重要的一點是,任何統計數據,無論是推論性的還是描述性的,都是樣本數據的函數。參數是總體的函數,其中術語總體與表示基礎數據生成過程相同。
從這個角度來看,數據的給定函數作為描述性或推斷性統計的狀態取決於您使用它的目的。
也就是說,一些統計數據在描述數據的相關特徵方面顯然更有用,有些統計數據非常適合輔助推理。
- 推論統計: 標準測試統計量,如 t 和 z,對於給定的數據生成過程,其中零假設為假,預期值受樣本大小的強烈影響。大多數研究人員不會將此類統計數據視為估計具有內在興趣的人口參數。
- 描述性統計:相比之下,描述性統計確實估計了通常具有內在興趣的總體參數。例如,樣本均值和標準差提供了等效總體參數的估計值。甚至像最小值和最大值這樣的描述性統計數據也提供了關於等效或相似人口參數的信息,儘管在這種情況下,當然需要更加小心。此外,許多描述性統計數據可能存在偏差或不符合理想估計量。但是,它們在估計感興趣的總體參數方面仍有一些效用。
因此,從這個角度來看,需要了解的重要事項是:
- 統計:樣本數據的函數
- 參數:人口的功能(數據生成過程)
- 估計器:用於提供參數估計的樣本數據的函數
- 推理:對參數得出結論的過程
因此,您可以根據研究人員使用統計數據的意圖來定義描述性和推理性之間的區別,也可以根據其通常使用方式來定義統計數據。