為什麼貝葉斯統計在統計過程控制中不受歡迎?
我對貝葉斯與常客辯論的理解是常客統計:
- 是(或聲稱是)客觀的
- 或至少不偏不倚
- 所以不同的研究人員,使用不同的假設仍然可以得到定量可比的結果
而貝葉斯統計
- 聲稱做出“更好”的預測(即更低的預期損失),因為它可以使用先驗知識(以及其他原因)
- 需要更少的“臨時”選擇,用(至少在原則上)具有真實世界解釋的先驗/模型選擇來代替它們。
鑑於此,我預計貝葉斯統計在 SPC 中會非常流行:如果我是一個試圖控制我的過程質量的工廠主,我會主要關心預期損失;如果我可以減少這一點,因為我比我的競爭對手擁有更多/更好的先驗知識,那就更好了。
但實際上我所讀到的關於 SPC 的所有內容似乎都是堅定的常客(即沒有先驗分佈、所有參數的點估計、關於樣本大小的許多臨時選擇、p 值等)
這是為什麼?我可以理解為什麼頻率統計在 1960 年代是更好的選擇,當時 SPC 是使用筆和紙完成的。但是為什麼從那以後沒有人嘗試不同的方法呢?
警告我很久以前寫了這個答案,幾乎不知道我在說什麼。我不能刪除它,因為它已被接受,但我不能支持大部分內容。
這是一個很長的答案,我希望它會在某種程度上有所幫助。SPC 不是我的領域,但我認為這些評論足夠籠統,適用於此處。
我認為最常被引用的優勢 -結合先前信念的能力- 是應用/經驗領域的弱優勢。那是因為你需要量化你的先驗。即使我可以說“嗯,z 級絕對不可信”,我也無法終生告訴你低於 z 會發生什麼。除非作者開始成群結隊地發布他們的原始數據,否則我對先驗的最佳猜測是從以前的工作中提取的條件時刻,這些條件可能會或可能不會在與您所面臨的相似條件下進行擬合。
基本上,貝葉斯技術(至少在概念層面上)非常適合當您有一個強大的假設/想法/模型並希望將其用於數據,然後看看您的錯誤與否。但是,您通常不會查看您對業務流程的某個特定模型是否正確;你更有可能沒有模型,並正在查看您的流程將要做什麼。你不想推你的結論,你希望你的數據來推你的結論。如果您有足夠的數據,無論如何都會發生這種情況,但是在這種情況下,為什麼還要打擾先驗呢?也許這是過度懷疑和規避風險,但我從未聽說過一個樂觀的商人也取得了成功。沒有辦法量化你對自己信念的不確定性,你寧願不要冒對錯誤的事情**過度自信的風險。**所以你設置了一個無信息的先驗,優勢就消失了。
這在 SPC 案例中很有趣,因為與數字營銷不同,您的業務流程不會永遠處於不可預測的變化狀態。我的印像是,業務流程往往會有意地、漸進地改變。也就是說,你有很長的時間來建立良好、安全的先驗。但請記住,先驗都是關於傳播不確定性的。拋開主觀性不談,貝葉斯主義的優勢在於它客觀地在深度嵌套的數據生成過程中傳播不確定性。對我來說,這確實是貝葉斯統計的好處。如果您正在尋找遠遠超出 20 分之一“重要性”截止值的過程可靠性,那麼您似乎希望盡可能多地考慮不確定性。
那麼貝葉斯模型在哪裡呢?首先,它們很難實施. 說白了,我可以在 15 分鐘內將 OLS 教給機械工程師,讓他在另外 5 分鐘內在 Matlab 中進行回歸和 t 檢驗。要使用貝葉斯,我首先需要確定我要擬合什麼樣的模型,然後看看是否有一個現成的庫,用我公司有人知道的語言。如果沒有,我必須使用 BUGS 或 Stan。然後我必須運行模擬以獲得基本答案,這在 8 核 i7 機器上大約需要 15 分鐘。快速原型製作就這麼多。其次,當你得到答案時,你已經花費了兩個小時的編碼和等待,只是為了得到與具有聚集標準錯誤的常客隨機效應相同的結果。也許這一切都是冒昧和錯誤的,我根本不懂SPC。
我把貝葉斯主義比作一把非常優質的廚師刀、一個湯鍋和一個炒鍋;頻率主義就像一個廚房,裡面裝滿了電視上的工具,比如香蕉切片機和意大利面罐,蓋子上有孔,便於排水。如果您是一名熟練的廚師,並且在廚房方面擁有豐富的經驗——事實上,在您自己擁有大量知識的廚房裡,廚房乾淨整潔,而且您知道所有東西的位置——您可以用您的一小部分選擇做出令人驚奇的事情優雅,高品質的工具。或者,您可以使用一堆不同的小型 ad-hoc* 工具,這些工具需要零技能才能使用,來製作簡單的餐點,真的不錯,並且有幾個基本的口味可以傳達要點。你剛從數據礦回到家,你渴望得到結果;你是哪個廚師?
*貝葉斯同樣是臨時的,但不那麼透明。你的 coq au vin 裡有多少酒?不知道,你關注它是因為你是專業人士。或者,你無法區分灰比諾和黑比諾,但 Epicurious 上的第一個食譜說要使用 2 杯紅比諾,所以這就是你要做的。哪個更“臨時”?