Terminology
“計數比例”和“連續比例”有什麼區別?
在對另一個問題的評論中,有人詢問正在討論的主題是“計數比例”還是“連續比例”,並且後續表明差異是關鍵信息(對於邏輯/二項式與貝塔回歸的主題)。
兩者之間的區別是什麼,區別在哪裡很重要?使用“計數比例”與使用“連續比例”時要記住哪些重要事項?
也許一個例子會有所幫助。假設你觀察了一些人併計算其中有多少是女性。得到的比例就是所謂的計數比例,取值介於 0 和 1 之間,但僅其中是您觀察到的總數。假設您從當地超市購買了一根香腸,並在標籤上觀察到它是 80% 的豬肉,這是連續比例的一個例子,可以取 0 到 100 之間的任何值。
建模的區別在於,在第一種情況下,預測隨機人是女性的概率是有意義的(邏輯回歸),但在第二種情況下,這不是一個明智的問題,而其他的東西(通常是 beta 回歸)將是首選.