Probability

為什麼我們需要 sigma 代數來定義概率空間?

  • March 1, 2016

我們有一個隨機實驗,不同的結果形成了樣本空間 $ \Omega, $ 我們感興趣地觀察某些模式,稱為事件 $ \mathscr{F}. $ **Sigma 代數(或 sigma 域)**由概率度量的事件組成 $ \mathbb{P} $ 可以賦值。滿足某些屬性,包括包含空集 $ \varnothing $ 和整個樣本空間,以及用維恩圖描述聯合和交集的代數。

概率被定義為 $ \sigma $ -代數和區間 $ [0,1] $ . 總而言之,三 $ (\Omega, \mathscr{F}, \mathbb{P}) $ 形成一個概率空間

有人可以用簡單的英語解釋為什麼如果我們沒有一個概率大廈會倒塌嗎? $ \sigma $ -代數?它們只是被那個不可思議的書法“F”夾在中間。我相信它們是必要的;我看到事件與結果不同,但如果沒有 $ \sigma $ -代數?

問題是:在什麼類型的概率問題中,概率空間的定義包括 $ \sigma $ -代數成為必需品?


達特茅斯大學網站上的這份在線文檔提供了簡單易懂的英文解釋。這個想法是一個旋轉指針在單位周長的圓上逆時針旋轉:

在此處輸入圖像描述

我們首先構建一個微調器,它由一個單位周長的圓和一個指針組成,如圖所示。我們在圓上選擇一個點並標記它 $ 0 $ ,然後用距離標記圓上的每個其他點,比如說 $ x $ , 從 $ 0 $ 到那一點,逆時針測量。該實驗包括旋轉指針並記錄指針尖端的點標籤。我們讓隨機變量 $ X $ 表示這個結果的值。樣本空間顯然是區間 $ [0,1) $ . 我們想構建一個概率模型,其中每個結果發生的可能性相同。如果我們像我們所做的那樣 […] 進行具有有限數量可能結果的實驗,那麼我們必須分配概率 $ 0 $ 對於每個結果,否則,所有可能結果的概率之和將不等於 1。(事實上,將不可數的實數相加是一件棘手的事情;特別是,為了得到這樣的總和有任何意義,最多可數許多加法可以不同於 $ 0 $ .) 但是,如果所有分配的概率都是 $ 0 $ , 那麼總和是 $ 0 $ , 不是 $ 1 $ ,因為它應該是。

因此,如果我們為每個點分配任何概率,並且假設有(不可數)無限個點,它們的總和將加起來 $ > 1 $ .

給西安的第一點:當你在談論 $ \sigma $ -代數,你問的是可測集,所以不幸的是,任何答案都必須集中在測度論上。不過,我會盡量做到這一點。

承認不可數集的所有子集的概率理論將破壞數學

考慮這個例子。假設你有一個單位正方形 $ \mathbb{R}^2 $ ,並且您對隨機選擇作為單位正方形中特定集合成員的點的概率感興趣。在很多情況下,這可以很容易地根據不同集合的區域的比較來回答。例如,我們可以畫一些圓,測量它們的面積,然後將概率作為正方形落在圓中的分數。很簡單的。

但是,如果感興趣集的區域沒有明確定義怎麼辦?

如果該區域沒有明確定義,那麼我們可以推斷出關於該區域是什麼的兩個不同但完全有效(在某種意義上)的結論。所以我們可以有 $ P(A)=1 $ 一方面和 $ P(A)=0 $ 另一方面,這意味著 $ 0=1 $ . 這打破了所有無法修復的數學問題。你現在可以證明 $ 5<0 $ 以及其他一些荒謬的事情。顯然這不是太有用。

$ \boldsymbol{\sigma} $ -代數是修復數學的補丁

什麼是 $ \sigma $ -代數,確切地說?其實沒那麼可怕。它只是對哪些集合可以被視為事件的定義。不在的元素 $ \mathscr{F} $ 根本沒有定義的概率度量。基本上, $ \sigma $ -代數是讓我們避免一些數學病態行為的“補丁”,即不可測集。

A的三個要求 $ \sigma $ -field 可以被認為是我們想要對概率做的事情的結果:A $ \sigma $ -field 是一個具有三個屬性的集合:

  1. 在可數聯合下關閉。
  2. 在可數交叉口下閉合。
  3. 補語下的閉包。

可數並集和可數交集組件是不可測集問題的直接後果。補碼下的閉包是 Kolmogorov 公理的結果:如果 $ P(A)=2/3 $ , $ P(A^c) $ 必定是 $ 1/3 $ . 但如果沒有(3),它可能會發生 $ P(A^c) $ 未定義。那會很奇怪。補碼下的閉包和 Kolmogorov 公理讓我們可以這樣說 $ P(A\cup A^c)=P(A)+1-P(A)=1 $ .

最後,我們正在考慮與 $ \Omega $ ,所以我們進一步要求 $ \Omega\in\mathscr{F} $

好消息: $ \boldsymbol{\sigma} $ -代數僅對不可數集是嚴格必要的

但!這裡也有好消息。或者,至少,一種繞過這個問題的方法。我們只需要 $ \sigma $ -代數,如果我們在一個具有不可數基數的​​集合中工作。如果我們將自己限制在可數集合中,那麼我們可以取 $ \mathscr{F}=2^\Omega $ 的冪集 $ \Omega $ 我們不會有任何這些問題,因為對於可數 $ \Omega $ , $ 2^\Omega $ 僅由可測集組成。(這在西安的第二條評論中有所提及。)您會注意到,有些教科書實際上會在這裡使用一種微妙的技巧,並且在討論概率空間時只考慮可數集。

此外,在幾何問題中 $ \mathbb{R}^n $ , 只考慮 $ \sigma $ - 由集合組成的代數 $ \mathcal{L}^n $ 措施被定義。為了更牢固地接地, $ \mathcal{L}^n $ 為了 $ n=1,2,3 $ 對應於通常的長度、面積和體積概念。所以我在前面的例子中說的是,集合需要有一個明確定義的區域,才能為其分配幾何概率。原因是這樣的:如果我們承認不可測量的集合,那麼我們最終可能會遇到這樣的情況:我們可以根據一些證據將概率 1 分配給某個事件,而根據其他一些證據將概率 0 分配給同一事件事件。

但是不要讓與不可數集合的聯繫讓您感到困惑!一個普遍的誤解是 $ \sigma $ -代數是可數集。事實上,它們可能是可數的,也可能是不可數的。考慮這個例子:和以前一樣,我們有一個單位正方形。定義$$ \mathscr{F}=\text{All subsets of the unit square with defined $\mathcal{L}^2$ measure}. $$你可以畫一個正方形 $ B $ 有邊長 $ s $ 對所有人 $ s \in (0,1) $ ,並且有一個角在 $ (0,0) $ . 應該清楚的是,這個正方形是單位正方形的一個子集。而且,所有這些正方形都有定義的面積,所以這些正方形是 $ \mathscr{F} $ . 但也應該清楚,有無數個正方形 $ B $ :這樣的方格數不可數,每個方格都定義了勒貝格測度。

因此,作為一個實際問題,簡單地進行該觀察通常足以使您僅考慮 Lebesgue 可測集以在解決感興趣的問題方面取得進展。

但是等等,什麼是不可測量的集合?

恐怕我自己只能對此有所了解。但是Banach-Tarski 悖論(有時是“太陽和豌豆”悖論)可以幫助我們:

給定一個 3 維空間中的實心球,將球分解為有限數量的不相交子集,然後可以以不同的方式將它們重新組合在一起,從而產生原始球的兩個相同副本。事實上,重新組裝過程只涉及移動部件並旋轉它們,而不改變它們的形狀。然而,這些碎片本身並不是通常意義上的“固體”,而是點的無限分散。重建可以使用少至五件。

該定理的一個更強的形式意味著給定任何兩個“合理的”固體物體(例如一個小球和一個大球),其中一個可以重新組裝成另一個。這通常被非正式地表述為“豌豆可以被切碎並重新組裝成太陽”,並被稱為“豌豆和太陽悖論”。1

因此,如果您正在使用概率 $ \mathbb{R}^3 $ 並且您正在使用幾何概率度量(體積比),您想計算出某些事件的概率。但是您將很難準確地定義該概率,因為您可以重新排列空間集以改變體積!如果概率取決於體積,並且您可以將集合的體積更改為太陽的大小或豌豆的大小,那麼概率也會發生變化。因此,任何事件都不會具有單一的概率。更糟糕的是,你可以重新排列 $ S\in\Omega $ 這樣的體積 $ S $ 擁有 $ V(S)>V(\Omega) $ ,這意味著幾何概率測度報告了一個概率 $ P(S)>1 $ ,公然違反要求概率具有測度 1 的 Kolmogorov 公理。

為了解決這個悖論,可以做出以下四種讓步之一:

  1. 旋轉時,集合的體積可能會發生變化。
  2. 兩個不相交集的並集的體積可能不同於它們的體積之和。
  3. Zermelo-Fraenkel 集合論的公理與選擇公理 (ZFC) 可能必須改變。
  4. 一些集合可能被標記為“不可測量”,並且在談論它的數量之前需要檢查一個集合是否是“可測量的”。

選項(1)無助於使用定義概率,所以它已經出局了。選項(2)違反了第二個 Kolmogorov 公理,所以它被淘汰了。選項 (3​​) 似乎是一個糟糕的主意,因為 ZFC 解決的問題比它產生的問題多得多。但是選項(4)似乎很有吸引力:如果我們發展出一個關於什麼是可測量的和不可測量的理論,那麼我們將在這個問題上有明確定義的概率!這讓我們回到了測量理論,我們的朋友 $ \sigma $ -代數。

引用自:https://stats.stackexchange.com/questions/199280

comments powered by Disqus