Scales

對評分系統進行加權以偏愛更多人評價高的項目而不是較少人評價高的項目?

  • January 18, 2011

提前感謝您對我的支持,我不是任何類型的統計學家,也不知道如何描述我的想像,所以穀歌在這裡沒有幫助我……

我正在開發的 Web 應用程序中包含一個評級系統。每個用戶可以對每個項目進行一次準確的評分。

我在想像一個有 4 個值的量表:“非常不喜歡”、“不喜歡”、“喜歡”和“非常喜歡”,我計劃分別分配這些值 -5、-2、+2 和 +5 .

現在,如果每個項目都有相同數量的評分,那麼我會對這個評分系統感到非常滿意,因為它可以清楚地區分最喜歡和最不喜歡的項目。但是,這些項目不會有相同的評分數,並且不同照片的投票數之間的差異可能相當大。

在這種情況下,比較兩個項目的累積分數意味著一個具有很多平庸評級的舊項目將比一個具有更少投票數的特殊新項目獲得更高的分數。

所以,我想到的第一個顯而易見的事情就是取平均分……但是現在,如果一個項目只有一個評分為“+5”,它的平均評分比一個評分為 99 個“+5”評分的項目要好和 1 個“+2”評級。直觀地說,這並不能準確表示一個項目的受歡迎程度。

我想這個問題很常見,你們不需要我用更多的例子來詳細說明它,所以我會在這一點上停下來,如果需要的話,在評論中詳細說明。

我的問題是:

  1. 這類問題叫什麼,有用於解決它的技術的術語嗎?我想知道這個,所以我可以閱讀它。
  2. 如果您碰巧知道有關該主題的任何外行友好資源,我將非常感謝您提供鏈接。
  3. 最後,對於如何有效收集和分析此類數據的任何其他建議,我將不勝感激。

解決此問題的一種方法是在每個類別中使用比例,這不需要您為每個類別輸入數字(您可以將其保留為 80% 為“非常喜歡”)。然而,比例確實受到少數評級問題的影響。這在您的示例中顯示,具有 1 +5 評級的照片將獲得比具有 99 +5 和 1 +2 評級的照片更高的平均分數(和比例)。這不符合我的直覺(我懷疑大多數人)。

解決這個小樣本量問題的一種方法是使用稱為“拉普拉斯繼承規則”的貝葉斯技術(搜索該術語可能很有用)。它只涉及在計算概率之前向每個類別添加 1 個“觀察值”。如果您想對數值取平均值,我建議您使用加權平均值,其中權重是通過繼承規則計算的概率。

對於數學形式,讓分別表示“非常不喜歡”、“不喜歡”、“喜歡”和“非常喜歡”的響應數(在兩個示例中,和)。然後,您計算強烈喜歡的概率(或權重)為

對於您給出的兩個示例,它們給出“強烈喜歡”的概率為 和 我認為這更接近於“常識”。刪除添加的常量給出和這使得第一個結果看起來比它應該的要高(至少對我來說)。

各自的分數只是由加權平均值給出,我在下面寫成:

或者更簡潔地說

這在兩個例子中給出了分數和. 我認為這顯示了兩種情況之間的適當差異。

這可能有點“數學”,所以如果您需要更多解釋,請告訴我。

引用自:https://stats.stackexchange.com/questions/6358

comments powered by Disqus