References

為什麼我們使用術語“人口”而不是“數據生成過程”?

  • May 8, 2021

我一直對統計學中“人口”一詞的使用感到困惑。在我的第一個統計課程中,我被告知我們需要一個樣本,因為調查整個人口的成本太高。所以有整個人口,我們研究的樣本很小。

問題在於,除了一些玩具示例之外,這種直覺是錯誤的,因為人口實際上是美國(或世界)的全部人口。實際上,即使在這幾個例子中,它也可能是錯誤的,因為世界人口只是 DGP 中假設的重複隨機樣本之一。因此,當我們在接下來的統計學課程中開始估計多元模型時,我一直在努力理解現在的人口是什麼,以及它與樣本有何不同。

因此,我對教授統計學的方式感到非常困惑。我覺得人們使用“人口”這個詞部分是因為歷史原因,部分是因為它更容易解釋 Stat 101 中樣本的概念。問題是它教導了錯誤的直覺,學生必須在以後忘記並創造對最基本的統計概念的理解存在漏洞。另一方面,DGP的概念在初級統計學課程中較難引入,但學生理解了之後,統計學的概念基礎就比較紮實了。

我有兩個問題:

  1. 我猜統計學家正在就這個問題進行討論,所以有人可以給我參考嗎?
  2. 更重要的是,您是否知道基於 DGP 和样本概念的入門級統計教科書的示例,它們放棄了“人口”並引入了統計數據?理想情況下,這樣的教科書將花費大量篇幅來解釋統計和統計推斷的概念基礎。

在討論統計分析時(例如,在討論時間序列過程、隨機過程等時),統計學家確實在很多情況下確實提到了一個*過程而不是一個總體。*形式上,隨機過程是一組具有公共域的隨機變量,索引在一組值上。這包括時間序列、隨機變量序列等。這個概念足以涵蓋大多數情況,其中我們有一組對統計問題感興趣的隨機變量,因此統計已經有足夠完善的語言指假設的隨機“過程”,也指事物的實際“種群”。

雖然統計學家確實提到和建模“過程”,但這些是通過考慮隨​​機變量的無限序列(或連續體)形成的抽象,因此它們涉及並非全部可觀察的假設量。術語“數據生成過程”本身就是有問題的(並且不如現有的“隨機過程”術語有用),我認為它的廣泛部署沒有理由增加對統計的更多理解。具體來說,通過提及“數據”的生成,該術語先於實際觀察到或可觀察到哪些量的問題。(想像一下您想引用“DGP”但隨後規定該過程的某些方面不能直接觀察到的情況。


**實證研究中的存在與過程:**我認為您認為有一些前提讓我覺得有問題,而且在我看來,這誤解了大多數使用統計學的實證研究的目標。當我們進行實證研究時,我們經常想了解現實中存在的事物之間的關係,而不是僅存在於我們的模型中的假設“過程”(即,作為現實的數學抽象)。實際上,在抽樣問題中,我們通常只希望估計與有限總體有關的某些數量分佈的某些方面。在這種情況下,當我們提到感興趣的“人群”時,我們只是指定了一組我們在特定研究問題中感興趣的事物。因此,如果我們目前對目前居住在美國的所有人感興趣,我們將把這個群體稱為“人口”(或“感興趣的人口”)。但是,如果我們只對目前居住在緬因州的人感興趣,那麼我們會將這個較小的群體稱為“人口”。在每種情況下,

(我注意到統計文本經常在感興趣對象的數量和與這些對像有關的感興趣的測量值之間產生輕微的模棱兩可。例如,對人的身高的分析可能在不同時間指的是一組人稱為“人口”,但隨後將相應的一組身高測量值稱為“人口”。這是一種速記,允許統計學家直接描述一組感興趣的數字。)

你在這裡的哲學方法與這個目標不一致。您似乎正在採用一種柏拉圖式的世界觀,其中現實世界的實體被認為不如某些假設的“數據生成過程”(假設)生成了世界那麼真實。例如,關於將地球上的所有人稱為“人口”的想法,您聲稱“……這可能是錯誤的,因為世界人口只是 DGP 中假設的重複隨機樣本之一”。這與柏拉圖的形式理論有很大的相似之處,柏拉圖認為對世界的觀察僅僅是對永恆形式的不完美觀察。在我看來,更好的方法是亞里士多德的觀點,即現實中的事物存在,我們從它們中抽像出來形成我們的概念。(這是對亞里士多德的簡化,但您了解基本概念。) $ ^\dagger $

柏拉圖和亞里士多德

如果你想涉足這個問題的文學,我想你會發現它更深入到哲學領域(特別是形而上學和認識論),而不是統計學領域。從本質上講,您在這裡的觀點是關於現實中存在的事物是否是與人類知識相關的適當對象,或者(相反)它們是否僅僅是一些更廣泛假設的“過程”的附帶現象,這是一個更廣泛的問題。人類推斷。這是一個哲學問題,一直是西方哲學史的重要組成部分,可以追溯到柏拉圖和亞里士多德,因此有大量文獻可以闡明這一點。

我希望這個答案能讓你踏上進入認識論領域的有趣旅程。出於目前的目的,您可能希望採取一種實用的觀點,同時考慮研究人員在研究中為自己設定的目標。問問自己:研究人員通常更願意了解生活在地球上的人的屬性,還是他們更願意嘗試找出你(假設的)可能生活在地球上而不是我們的人的“假設的重複隨機樣本”?


$ ^\dagger $ 為了避免那些缺乏歷史知識的人可能產生任何混淆,請注意這些不是柏拉圖和亞里士多德的真實引述——我只是以詩意的方式將他們的哲學立場與當前問題相提並論。

引用自:https://stats.stackexchange.com/questions/523331

comments powered by Disqus