Confidence-Interval

當您擁有全部人口時,是否適合在數據上放置“誤差線”?

  • January 21, 2022

我有大量申請獲獎的人的數據。每個申請的人都必須填寫一份調查表並註明他們的性別(儘管他們可以選擇“寧願不說”)。我的問題:考慮到調查不是人口樣本,而是整個人口,在這些數據上加上“誤差線”是否合適?(任何引用都會有所幫助。)

誤差線顯示間隔;這些間隔必須代表什麼

圖中的誤差線顯示特定數量的區間,並且與圖中的任何元素一樣,這些區間必須實際**代表某些東西。圖中的區間通常在兩種情況下有用:當您想要顯示未知量的區間估計時,或者當您想要顯示代表樣本數據的某些描述性方面的區間時。

誤差線最常見的用途是當您使用數據估計*未知數量時。通常,當我們對某個未知量(即單個點)進行估計時會發生這種情況,然後使用誤差線對包含點估計的量進行區間估計。*在您的情況下,您有一個完整的值群體,因此您沒有未知數量的興趣。有時人們可能希望使用完整的人口數據來推斷假設的“超級人口”(以及人口的無限擴展)的某些未知方面,在這種情況下,可能會有一些未知數量的興趣。

有時使用誤差線的另一種情況是,當您想要顯示與已知描述性數量相關的區間範圍時,而不是作為未知數量的區間估計。例如,在盒須圖中使用了一個有點類似於“誤差線”的圖形元素. 更一般地說,如果您有一組具有連續測量值的樣本數據分為幾類,通常會給出一個均值條形圖,其中條形圖顯示每個類別中連續值的子樣本的一些描述性範圍(例如,四分位間距,或與樣本均值的一定數量的樣本標準偏差等)。在這種情況下,條形用於指示與樣本有關的某種描述範圍。嚴格來說,這些條不代表“錯誤”,但它們在圖形上與表示考慮“錯誤”的區間估計的條在圖形上相同。

通常這兩種情況之間存在交叉,當與數據有關的描述性區間也用作數據外對象的某個未知量的區間估計時。在任何情況下,每當您生成帶有誤差線的圖時,您必須確保您的誤差線的含義是清晰的。對於某些圖,如盒須圖,條形圖的含義是按照慣例固定的(因此不需要解釋),但在其他情況下,您應該告訴讀者您的圖上的誤差線代表什麼。

如果您認為您可能需要使用誤差線或其他與誤差線在圖形上相同的線,您需要退後一步問自己:我建議用這些線顯示的間隔的目的是什麼?它是對未知量的區間估計嗎?(如果是,未知量是多少?您使用的是什麼類型的區間估計器?)它是代表數據某些方面的區間嗎?(如果是,它代表數據的哪個方面?)如果您對這些問題沒有滿意的答案,那麼您不需要在數據圖中使用誤差線。

引用自:https://stats.stackexchange.com/questions/561282

comments powered by Disqus