根據測量誤差選擇先驗
如果您有儀器的測量誤差,您如何計算適當的先驗?這一段來自 Cressie 的《Statistics for Spatio-Temporal Data》一書:
通常情況下,一些關於測量誤差方差的先驗信息是可用的,從而可以指定一個相當豐富的參數模型。例如,如果我們假設條件獨立的測量誤差是獨立同分佈的 ,那麼我們應該為. 假設我們對環境空氣溫度感興趣,我們看到儀器製造商的規格表明存在“錯誤”. 假設這個“錯誤”對應於 2 個標準偏差(應該檢查的假設!),我們可以指定有一個先驗平均值. 由於儀器製造商的規範,我們假設分佈在 0.0025 處具有明確定義且相當窄的峰值(例如,反伽馬)。事實上,我們可以固定在 0.0025;然而,數據模型誤差也可能具有其他不確定性成分(第 7.1 節)。為避免過程模型錯誤可能出現的可識別性問題,建模人員在科學允許的範圍內盡可能減少不確定性非常重要,包括進行旨在復制數據的輔助研究。
有誰知道如上所述獲得先驗值的一般程序是什麼(儘管該段僅指獲得先驗均值)?
兩種標準方法是
- 請參閱報價單中**的“儀器製造商規格” 。**這通常是在沒有其他信息可用時使用的粗略回退,因為 (a) 儀器製造商所說的“準確度”和“精確度”的真正含義通常是不確定的,以及 (b) 儀器在新儀器出現時如何響應測試實驗室的性能可能比在現場使用時要好得多。
- 收集重複樣本。 在環境採樣中,大約有六個級別的樣本被常規複製(以及更多可以復制的級別),每個級別都用於控制可分配的變異來源。此類來源可能包括:
- 取樣人的身份。
- 在獲取樣本之前進行的初步程序,例如打撈井。
- 物理採樣過程中的可變性。
- 樣品體積本身的異質性。
- 保存樣品並將其運送到實驗室時可能發生的變化。
- 初步實驗室程序的變化,例如均質化物理樣品或將其消化以進行分析。
- 實驗室分析員的身份。
- 實驗室之間的差異。
- 物理上不同的儀器之間的差異,例如兩個氣相色譜儀。
- 儀器校準隨時間漂移。
- 晝夜變化。(這可能是自然的和系統的,但當採樣時間是任意的時可能會顯得隨機。)
只有根據適當的實驗設計系統地改變這些因素中的每一個,才能獲得對可變性成分的完整定量評估。
通常只研究被認為貢獻最大可變性的來源。例如,許多研究將在獲得樣本後系統地拆分一定部分的樣本,並將它們運送到兩個不同的實驗室。對這些拆分結果之間差異的研究可以量化它們對測量變異性的貢獻。如果獲得了足夠多的此類分割,則可以在分層貝葉斯時空模型中將測量變異性的完整分佈估計為先驗。因為許多模型假設高斯分佈(對於每個計算),獲得高斯先驗最終歸結為估計分裂之間差異的均值和方差。在更複雜的研究中,旨在識別不止一個方差分量,
甚至考慮這些問題的好處之一是,它們可以幫助您確定減少甚至消除其中一些錯誤成分的方法(無需量化它們),從而更接近 Cressie & Wikle 的“減少不確定性”的理想在科學允許的範圍內。”
有關擴展工作示例(在土壤採樣中),請參見
Van Ee、Blume 和 Starks,土壤採樣誤差評估的基本原理。 美國環保署,1990 年 5 月:EPA/600/4-90/013。