Gaussian-Process

高斯過程模型的主要優點

  • April 13, 2016

高斯過程已被廣泛使用,尤其是在仿真中。眾所周知,計算需求很高().

  1. 是什麼讓它們受歡迎?
  2. 它們的主要優勢和隱藏優勢是什麼?
  3. 為什麼使用它們而不是參數模型(參數模型是指典型的線性回歸,其中可以使用不同的參數形式來描述輸入與輸出趨勢;例如,qaudratic)?

我真的很感激一個技術答案,解釋使高斯過程獨特和有利的固有屬性

從工程的角度來看,主要優點是(正如@Alexey 提到的)。在廣泛使用的克里金法中,您可以通過為取決於距離和方向的關係提供“相關”(或協方差)模型(通常稱為變異函數橢圓體)來解釋您自己的“空間”。

沒有什麼可以阻止其他方法具有相同的特徵,只是碰巧克里金法最初被概念化的方式對非統計學家的人來說是一種友好的方法。

如今,隨著基於地質統計學的隨機方法的興起,例如順序高斯模擬等,這些程序正被用於定義不確定性空間(可能需要數千到數百萬維)很重要的領域。同樣,從工程的角度來看,基於地質統計學的算法很容易包含在遺傳編程中。因此,當您遇到逆問題時,您需要能夠測試多個場景並測試它們對優化函數的適應性。

讓我們暫時擱置純粹的論證,為這種用法的現代真實示例陳述事實。您可以直接對地下樣本進行採樣(硬數據),也可以製作地下地震圖(軟數據)。

在硬數據中,您可以直接測量屬性(比如說聲阻抗)而不會出現(ish)錯誤。問題是這是稀缺的(而且很昂貴)。另一方面,你有地震映射,它實際上是一個體積、像素級的地下映射,但不會給你聲阻抗。為簡單起見,假設它為您提供了兩個聲阻抗值(頂部和底部)之間的比率。因此,0.5 的比率可能是 1000/2000 或 10 000/ 20 000 的除法。這是一個多解空間,可以進行多種組合,但只有一種可以準確地代表現實。你如何解決這個問題?

地震反演的工作方式(隨機程序)是通過產生合理的(這是另一個故事)聲阻抗(或其他屬性)場景,將這些場景轉換為合成地震(如前面示例中的比率)和將合成地震與真實地震進行比較(相關性)。最好的場景將被用來產生更多的場景,匯聚成一個解決方案(這並不像看起來那麼容易)。

考慮到這一點並從可用性的角度講,我將通過以下方式回答您的問題:

1) 使它們流行的原因是可用性、實施的靈活性、大量的研究中心和機構不斷為幾個不同的領域(特別是地球科學,包括 GIS)製作更新和更具適應性的基於高斯的程序。

2) 主要優點是,如前所述,從我的角度來看,可用性和靈活性。如果它易於操作且易於使用,您就去做。高斯過程中沒有在其他方法(統計或其他方法)中不可重現的特定特徵。

3) 您需要在模型中包含更多信息而不僅僅是數據時使用它們(例如具有空間關係、統計分佈等的信息……)。我可以保證,如果您有大量具有各向同性行為的數據,則使用克里金法是浪費時間。您可以使用任何其他方法獲得相同的結果,這些方法需要的信息更少,運行速度更快。

引用自:https://stats.stackexchange.com/questions/207183

comments powered by Disqus

相關問答