基本辛普森悖論

January 28, 2012

我有一個關於我的統計老師所說的關於以下問題的問題：

你所在的鎮上有兩家醫院，分別名為 Mercy 和 Hope。您必須選擇其中一項進行手術。您決定根據他們的手術團隊的成功做出決定。幸運的是，根據新的健康計劃，醫院提供了有關其手術成功的數據，分為五類手術。假設您獲得以下兩家醫院的數據：
Mercy Hospital
Type         A    B      C    D      E    All
Operations  359  1836   299   2086  149  4729
Successful  292  1449   179   434   13   2366
Hope Hospital 
Type          A   B  C   D   E   All
Operations   88 514 222 86  45   955
Successful   70 391 113 12  2    588
您注意到，在所有類型的操作中，Mercy 的成功率都高於 Hope，但 Hope 的總體成功率最高。您會選擇哪家醫院以及為什麼（選擇兩個答案）？

A) 憐憫；因為我會去做特定的手術，所以我想要那個手術成功率最高的醫院。

B) 希望；由於他們在所有類別中進行的操作較少，因此他們不像 Mercy 那樣“樂於操作”。

C) 希望；這是辛普森悖論的一個例子，我們應該始終選擇“顯而易見”的結論。

D) 憐憫；查看 E 列，Mercy 顯然做了更困難的手術，因此可能是一家更好的醫院。

E) 希望；它具有更好的整體成功率。

F) 憐憫；這是辛普森悖論的一個例子，我們應該始終選擇與“顯而易見”結論相反的結果。

我的問題甚至不是關於在這種情況下發生辛普森悖論的問題。我的問題只是關於我的教授堅持認為 A) 和 D) 是正確答案而不是 A) 和 F) 的事實。他說，

“由於 E 型手術的成功率非常低，我們可以得出結論，它們很困難，而且不僅不常見。因此，與希望相比，Mercy 可能擁有更好的設備/醫生。”

我不明白他怎麼能在統計基礎上暗示他可以說 Mercy 做了“更困難的手術”。很明顯，Mercy 在 E 型手術中的成功率更高，但為什麼這意味著他們會做“更難的手術”。我想我被這個問題的措辭搞砸了，教授並沒有讓步。有人可以解釋為什麼我錯了或者我如何向教授解釋這個嗎？

我認為A和E不是一個好的組合，因為A說你應該選擇Mercy，E說你應該選擇Hope。

A 和 D 有主張相同選擇的美德。但是，讓我們更詳細地檢查 D 中的推理線，因為這似乎是混亂的。手術成功的概率在兩家醫院遵循相同的順序，A 型最有可能成功，E 型最不可能成功。如果我們崩潰（即忽略）醫院，我們可以看到手術成功的邊際概率為：
Type     A     B     C     D     E     All  
Prob   .81   .78   .56   .21   .08     .52
因為 E成功的可能性要小得多，所以可以合理地想像它會更加困難（儘管在現實世界中，也存在其他可能性）。我們也可以將這種思路擴展到其他四種類型。現在讓我們看看每家醫院每種類型的手術量佔多少比例：
Type     A     B     C     D     E  
Mercy  .08   .39   .06   .44   .03  
Hope   .09   .54   .23   .09   .05
我們在這裡註意到的是，Hope 傾向於做更多更簡單的 AC 手術（尤其是 B 和 C），而像 D.E 這樣較難的手術在兩家醫院都很少見，但是，就其價值而言，Hope 實際上做更高的百分比。儘管如此，辛普森悖論效應將主要由這裡的 BD 驅動（實際上不是 E 列作為答案選項 D 建議的）。

辛普森悖論的發生是因為手術難度不同（通常），也因為 N 不同。正是不同類型手術的不同基本費率使得這種做法有悖常理。如果兩家醫院進行的每種手術數量完全相同，就會很容易看出正在發生的事情。我們可以通過簡單地計算成功概率並乘以 100 來做到這一點；這會針對不同的頻率進行調整：
Type     A     B     C     D     E     All  
Mercy   81    79    60    21    09     250  
Hope    80    76    51    14    04     225
現在，因為兩家醫院每次手術都做了 100 次（總共 500 次），所以答案很明顯：Mercy 是更好的醫院。

引用自：https://stats.stackexchange.com/questions/21896

comments powered by Disqus

基本辛普森悖論

相關問答

如何解釋 Pearl 的 do 表示法？

邊際獨立的隨機變量是否有可能是條件依賴的？

我們如何處理與曝光共線的混雜因素？

通過選擇聚合數據來解決辛普森悖論的示例

辛普森悖論與伯克森悖論

辛普森悖論是否涵蓋了隱藏變量反轉的所有實例？