基本辛普森悖論
我有一個關於我的統計老師所說的關於以下問題的問題:
你所在的鎮上有兩家醫院,分別名為 Mercy 和 Hope。您必須選擇其中一項進行手術。您決定根據他們的手術團隊的成功做出決定。幸運的是,根據新的健康計劃,醫院提供了有關其手術成功的數據,分為五類手術。假設您獲得以下兩家醫院的數據:
Mercy Hospital Type A B C D E All Operations 359 1836 299 2086 149 4729 Successful 292 1449 179 434 13 2366 Hope Hospital Type A B C D E All Operations 88 514 222 86 45 955 Successful 70 391 113 12 2 588
您注意到,在所有類型的操作中,Mercy 的成功率都高於 Hope,但 Hope 的總體成功率最高。您會選擇哪家醫院以及為什麼(選擇兩個答案)?
A) 憐憫;因為我會去做特定的手術,所以我想要那個手術成功率最高的醫院。
B) 希望;由於他們在所有類別中進行的操作較少,因此他們不像 Mercy 那樣“樂於操作”。
C) 希望;這是辛普森悖論的一個例子,我們應該始終選擇“顯而易見”的結論。
D) 憐憫;查看 E 列,Mercy 顯然做了更困難的手術,因此可能是一家更好的醫院。
E) 希望;它具有更好的整體成功率。
F) 憐憫;這是辛普森悖論的一個例子,我們應該始終選擇與“顯而易見”結論相反的結果。
我的問題甚至不是關於在這種情況下發生辛普森悖論的問題。我的問題只是關於我的教授堅持認為 A) 和 D) 是正確答案而不是 A) 和 F) 的事實。他說,
“由於 E 型手術的成功率非常低,我們可以得出結論,它們很困難,而且不僅不常見。因此,與希望相比,Mercy 可能擁有更好的設備/醫生。”
我不明白他怎麼能在統計基礎上暗示他可以說 Mercy 做了“更困難的手術”。很明顯,Mercy 在 E 型手術中的成功率更高,但為什麼這意味著他們會做“更難的手術”。我想我被這個問題的措辭搞砸了,教授並沒有讓步。有人可以解釋為什麼我錯了或者我如何向教授解釋這個嗎?
我認為A和E不是一個好的組合,因為A說你應該選擇Mercy,E說你應該選擇Hope。
A 和 D 有主張相同選擇的美德。但是,讓我們更詳細地檢查 D 中的推理線,因為這似乎是混亂的。手術成功的概率在兩家醫院遵循相同的順序,A 型最有可能成功,E 型最不可能成功。如果我們崩潰(即忽略)醫院,我們可以看到手術成功的邊際概率為:
Type A B C D E All Prob .81 .78 .56 .21 .08 .52
因為 E成功的可能性要小得多,所以可以合理地想像它會更加困難(儘管在現實世界中,也存在其他可能性)。我們也可以將這種思路擴展到其他四種類型。現在讓我們看看每家醫院每種類型的手術量佔多少比例:
Type A B C D E Mercy .08 .39 .06 .44 .03 Hope .09 .54 .23 .09 .05
我們在這裡註意到的是,Hope 傾向於做更多更簡單的 AC 手術(尤其是 B 和 C),而像 D.E 這樣較難的手術在兩家醫院都很少見,但是,就其價值而言,Hope 實際上做更高的百分比。儘管如此,辛普森悖論效應將主要由這裡的 BD 驅動(實際上不是 E 列作為答案選項 D 建議的)。
辛普森悖論的發生是因為手術難度不同(通常),也因為 N 不同。正是不同類型手術的不同基本費率使得這種做法有悖常理。如果兩家醫院進行的每種手術數量完全相同,就會很容易看出正在發生的事情。我們可以通過簡單地計算成功概率並乘以 100 來做到這一點;這會針對不同的頻率進行調整:
Type A B C D E All Mercy 81 79 60 21 09 250 Hope 80 76 51 14 04 225
現在,因為兩家醫院每次手術都做了 100 次(總共 500 次),所以答案很明顯:Mercy 是更好的醫院。