Self-Study

基本辛普森悖論

  • January 28, 2012

我有一個關於我的統計老師所說的關於以下問題的問題:


你所在的鎮上有兩家醫院,分別名為 Mercy 和 Hope。您必須選擇其中一項進行手術。您決定根據他們的手術團隊的成功做出決定。幸運的是,根據新的健康計劃,醫院提供了有關其手術成功的數據,分為五類手術。假設您獲得以下兩家醫院的數據:

Mercy Hospital
Type         A    B      C    D      E    All
Operations  359  1836   299   2086  149  4729
Successful  292  1449   179   434   13   2366
Hope Hospital 
Type          A   B  C   D   E   All
Operations   88 514 222 86  45   955
Successful   70 391 113 12  2    588

您注意到,在所有類型的操作中,Mercy 的成功率都高於 Hope,但 Hope 的總體成功率最高。您會選擇哪家醫院以及為什麼(選擇兩個答案)?

A) 憐憫;因為我會去做特定的手術,所以我想要那個手術成功率最高的醫院。

B) 希望;由於他們在所有類別中進行的操作較少,因此他們不像 Mercy 那樣“樂於操作”。

C) 希望;這是辛普森悖論的一個例子,我們應該始終選擇“顯而易見”的結論。

D) 憐憫;查看 E 列​​,Mercy 顯然做了更困難的手術,因此可能是一家更好的醫院。

E) 希望;它具有更好的整體成功率。

F) 憐憫;這是辛普森悖論的一個例子,我們應該始終選擇與“顯而易見”結論相反的結果。


我的問題甚至不是關於在這種情況下發生辛普森悖論的問題。我的問題只是關於我的教授堅持認為 A) 和 D) 是正確答案而不是 A) 和 F) 的事實。他說,

“由於 E 型手術的成功率非常低,我們可以得出結論,它們很困難,而且不僅不常見。因此,與希望相比,Mercy 可能擁有更好的設備/醫生。”

我不明白他怎麼能在統計基礎上暗示他可以說 Mercy 做了“更困難的手術”。很明顯,Mercy 在 E 型手術中的成功率更高,但為什麼這意味著他們會做“更難的手術”。我想我被這個問題的措辭搞砸了,教授並沒有讓步。有人可以解釋為什麼我錯了或者我如何向教授解釋這個嗎?

我認為A和E不是一個好的組合,因為A說你應該選擇Mercy,E說你應該選擇Hope。

A 和 D 有主張相同選擇的美德。但是,讓我們更詳細地檢查 D 中的推理線,因為這似乎是混亂的。手術成功的概率在兩家醫院遵循相同的順序,A 型最有可能成功,E 型最不可能成功。如果我們崩潰(即忽略)醫院,我們可以看到手術成功的邊際概率為:

Type     A     B     C     D     E     All  
Prob   .81   .78   .56   .21   .08     .52

因為 E成功的可能性要小得多,所以可以合理地想像它會更加困難(儘管在現實世界中,也存在其他可能性)。我們也可以將這種思路擴展到其他四種類型。現在讓我們看看每家醫院每種類型的手術量佔多少比例:

Type     A     B     C     D     E  
Mercy  .08   .39   .06   .44   .03  
Hope   .09   .54   .23   .09   .05

我們在這裡註意到的是,Hope 傾向於做更多更簡單的 AC 手術(尤其是 B 和 C),而像 D.E 這樣較難的手術在兩家醫院都很少見,但是,就其價值而言,Hope 實際上做更高的百分比。儘管如此,辛普森悖論效應將主要由這裡的 BD 驅動(實際上不是 E 列作為答案選項 D 建議的)。

辛普森悖論的發生是因為手術難度不同(通常),也因為 N 不同。正是不同類型手術的不同基本費率使得這種做法有悖常理。如果兩家醫院進行的每種手術數量完全相同,就會很容易看出正在發生的事情。我們可以通過簡單地計算成功概率並乘以 100 來做到這一點;這會針對不同的頻率進行調整:

Type     A     B     C     D     E     All  
Mercy   81    79    60    21    09     250  
Hope    80    76    51    14    04     225

現在,因為兩家醫院每次手術都做了 100 次(總共 500 次),所以答案很明顯:Mercy 是更好的醫院。

引用自:https://stats.stackexchange.com/questions/21896

comments powered by Disqus