Probability
作為期望的最大似然
我正在閱讀深度學習(Ian Goodfellow 和 Yoshua Bengio 和 Aaron Courville,2016 年)一書。我沒有統計背景,所以我無法遵循這部分:
為什麼只用公式(5.58)除以m 1 可以得到公式(5.59)。
作為後續問題,許多涉及求和的方程都用期望來表示。有沒有一種通用的方法來解釋如何將總和表示為期望?
讓. 那麼在(5.58)中被最大化的東西,在我們不相關地除以一個常數之後,是
現在,讓我們引入一個新的隨機變量,它遵循樣本的經驗分佈:它是一個離散隨機變量,它有存在的概率,存在的等。然後注意等於
這就是(5.59)中最大化的東西。他們的符號指的是樣本點的這種經驗分佈。