Pca

關於將具有不同反應量表的項目組合成複合量表的建議/文獻?

  • January 22, 2014

假設我有一些以李克特 5 點量表(非常不同意到非常同意)衡量的自我報告項目和以李克特 4 點量表衡量的其他項目(從不、很少、有時、經常)。誰能指出將這些項目組合成綜合量表的文獻(或實用建議)?為了論證,我們假設我們有一些經驗證據表明項目應該合併。

一些想法:

1. 匯總原始分數

優點:容易

缺點:5 分制(最初為 4 分)的最大響應比 4 分制(最初為 3 分)的最大響應提高了總分。

2.重新縮放和求和

將所有項目放在 0-1 的範圍內並求和。所以 4 分項 (0,1,2,3) 將乘以 (4/3)/4,5 分項 (0,1,2,3,4) 將乘以 1/4 ,分別產生 (0,.33,.66,1) 和 (0,.25,.50,.75,1) 的可能值。這樣,5 分制(最初為 4 分)的最大響應不會比 4 分制(最初為 3 分)的最大響應提高總量表分數。

優點:項目將具有相同的權重。(可能是一個騙局,取決於你的觀點)。

缺點:忽略不同指標上的項目之間的可變性差異?

3.標準化和求和

一種相關的方法是標準化所有項目(z 分數)然後求和。

優點:解決不同指標上的項目之間的可變性差異

缺點:總分變得更難解釋和样本特異性。後者使得很難將基準作為在其他設置/其他樣本中使用的度量。

4. PCA 或其他數據縮減

4a。EFA 以獲得因子載荷。將縮放項目乘以因子載荷。

4b。PCA 得到第一主成分的分數。

優點:按影響加權的項目。

缺點:與#2 相同。EFA 派生的分數可能會因輪換/提取選擇而有很大差異。有些人不會就序數數據提出建議。


總體:我喜歡#2,因為比較不同樣本的結果似乎更容易。想法?替代想法或對提出的想法的擔憂?

這是一個很好的問題!

我認為在尺度構建中,可解釋性和心理測量考慮之間存在微妙的平衡。具體來說,比例總和或平均值比標準化或以其他方式重新縮放的項目的總和或平均值更容易掌握。

然而,在創建您的比例組合之前(即,取一個總和或平均值),可能有一些微妙的心理測量原因需要重新調整項目。如果您的項目具有完全不同的標準偏差,那麼您的綜合量表的可靠性將僅僅因為這些不同的標準偏差而降低。

直觀地理解這一點的一種方法是認識到,正如您所指出的,具有廣泛變化的標準偏差的項目在組合中被分配了不同的權重。因此,具有較大標準偏差的項目中的測量誤差將傾向於在比例組合中占主導地位。實際上,具有廣泛變化的標準偏差會降低您試圖通過將多個項目平均在一起而獲得的好處(即,通常,將多個項目平均在一起會減少任何一個組成項目的測量誤差的影響)。

我在下面的一些模擬數據中創建了一個單一主導項目的影響的演示。在這裡,我創建了五個相關項目並找到了結果量表的可靠性(用 Cronbach’s alpha 測量)。

require(psych)

# Create data
set.seed(13105)
item1 <- round(rnorm(100, sd = 3), digits = 0)
item2 <- round(item1 + rnorm(100, sd = 1), digits = 0)
item3 <- round(item1 + rnorm(100, sd = 1), digits = 0)
item4 <- round(item1 + rnorm(100, sd = 1), digits = 0)
item5 <- round(item1 + rnorm(100, sd = 1), digits = 0)

d <- data.frame(item1, item2, item3, item4, item5)

# Cronbach's alpha
alpha(d)

Reliability analysis   
Call: alpha(x = d)

 raw_alpha std.alpha G6(smc) average_r  mean  sd
      0.97      0.97    0.97      0.87 -0.14 2.5

Reliability if an item is dropped:
     raw_alpha std.alpha G6(smc) average_r
item1      0.96      0.96    0.94      0.84
item2      0.97      0.97    0.96      0.88
item3      0.97      0.97    0.96      0.89
item4      0.97      0.97    0.96      0.88
item5      0.96      0.97    0.96      0.87

Item statistics 
       n    r r.cor r.drop  mean  sd
item1 100 0.98  0.99   0.97 -0.10 2.5
item2 100 0.94  0.92   0.90 -0.27 2.8
item3 100 0.93  0.91   0.89 -0.09 2.7
item4 100 0.94  0.92   0.91 -0.19 2.6
item5 100 0.94  0.93   0.91 -0.06 2.7

在這裡,我item2通過將項目乘以來更改標準偏差. 請注意,由於此過程,Cronbach 的 alpha 值急劇下降。另請注意,將一個項目乘以一個正常數絲毫不會影響由這五個項目構建的相關矩陣。我所做的唯一一件事是item2乘以是我改變了item2測量的尺度,然而改變這個尺度極大地影響了複合材料的可靠性。

# Re-scale item 2 to have a much larger standard deviation than the other items
d$item2 <- d$item2 * 5

# Cronbach's alpha
alpha(d)

Reliability analysis   
Call: alpha(x = d)

 raw_alpha std.alpha G6(smc) average_r  mean  sd
      0.74      0.97    0.97      0.87 -0.36 4.7

Reliability if an item is dropped:
     raw_alpha std.alpha G6(smc) average_r
item1      0.68      0.96    0.94      0.84
item2      0.97      0.97    0.96      0.88
item3      0.69      0.97    0.96      0.89
item4      0.68      0.97    0.96      0.88
item5      0.68      0.97    0.96      0.87

 Item statistics 
       n    r r.cor r.drop  mean   sd
item1 100 0.98  0.99   0.96 -0.10  2.5
item2 100 0.94  0.92   0.90 -1.35 13.9
item3 100 0.93  0.91   0.86 -0.09  2.7
item4 100 0.94  0.92   0.89 -0.19  2.6
item5 100 0.94  0.93   0.90 -0.06  2.7

引用自:https://stats.stackexchange.com/questions/83071

comments powered by Disqus