Correlation

如何計算變量組之間/內部的相關性?

  • April 24, 2011

我有一個包含 1000 個觀察值和 50 個變量的矩陣,每個變量都以 5 分制進行測量。這些變量被組織成組,但每組中的變量數量並不相同。

我想計算兩種相關性:

  1. 變量組內的相關性(特徵之間):對變量組內的變量是否測量相同事物的某種度量。
  2. 變量組之間的相關性:假設每個組反映一個整體特徵,衡量每個特徵(組)如何與其他所有特徵相關。

這些特徵先前已被分類成組。我有興趣找到組之間的相關性 - 即假設組內的特徵正在測量相同的潛在特徵(已完成上述#1 - Cronbach’s alpha),這些特徵本身是否相關?

有人對從哪裡開始有建議嗎?

@rolando 的建議看起來像是一個好的開始,如果不是整個響應 (IMO)。讓我繼續遵循經典測試理論 (CTT) 框架的相關方法。在這裡,正如@Jeromy 所指出的,您的一組特徵的匯總度量可能被視為屬於我現在稱為量表的所有項目(用您的話來說是一個特徵)的總分(或總和)。在 CTT 下,這使我們能夠將個人“特徵”傾向或責任形式化為反映潛在結構(潛在特徵)的連續尺度上的一個人的位置,儘管這裡它只是一個序數尺度(但這是心理測量學文獻中的另一場爭論) .

您所描述的與心理測量學中所謂的收斂性(屬於同一量表的項目在多大程度上相互關聯)和判別性(屬於不同量表的項目不應在很大程度上相關)有效性有關。經典技術包括多特徵多方法 (MTMM) 分析 (Campbell & Fiske, 1959)。下面顯示了它如何工作的說明(三種方法或工具,三種構造或特徵):

在此處輸入圖像描述

在這個 MTMM 矩陣中,對角線元素可能是 Cronbach 的 alpha 或重測類內相關性;這些是每個測量量表可靠性的指標。當使用不同的工具來評估相同的特徵時,通過量表分數的相關性來評估假設(共享)結構的有效性;如果這些儀器是獨立開發的,高相關性() 將支持以一致和客觀的方式定義特徵的想法。該 MTMM 矩陣中的剩餘單元格總結了方法內的特徵之間的關係,以及跨方法的特徵之間的關係,並指示了使用不同尺度測量獨特構造的方式以及給定尺度中每個特徵之間的關係。假設獨立特徵,我們通常不期望它們很高(推薦的閾值是),但可以進行更正式的假設檢驗(關於相關點估計)。一個微妙之處在於我們使用了所謂的“剩餘相關性”,即我們在去除該項目對該量表總分的貢獻後計算該項目(或特徵)與其量表(或方法)之間的相關性(校正重疊)。

即使這種方法最初是為了評估通過不同測量工具研究的某些特徵的收斂效度和判別效度,它也可以應用於單一的多尺度工具。特徵然後成為項目,方法只是不同的尺度。將此方法推廣到單個儀器也稱為多特徵縮放。與預期相關的項目(即,具有自己的規模而不是不同的規模)被視為擴展成功. 然而,我們通常假設不同的尺度不相關,即它們針對不同的假設結構。但是,平均尺度內和尺度間的相關性提供了一種總結儀器內部結構的快速方法。另一種方便的方法是對成對相關矩陣應用聚類分析,看看你的變量是如何联系在一起的。

值得注意的是,在這兩種情況下,使用相關測量的常見警告都適用,即您無法解釋測量誤差,您需要大樣本,儀器或測試被假定為“平行”(tau 等效、不相關誤差、相等的誤差方差)。

@rolando 解決的第二部分也很有趣:如果沒有理論上或實質性的跡象表明已經建立的項目分組是有意義的,那麼您將必須找到一種方法來突出數據的結構,例如探索性因素分析. 但即使你相信那些“群體內的特徵”,你也可以檢查這是否是一個有效的假設。現在,您可能正在使用驗證性因子分析模型來檢查項目加載模式(項目與其自身規模的相關性)是否符合預期。

除了傳統的因子分析方法,您還可以查看項目聚類 (Revelle, 1979),它依賴於 Cronbach 的基於 alpha 的拆分規則將項目組合成同質尺度。

最後一句話:如果您使用的是 R,有兩個非常好的包可以簡化上述步驟:

  • psych,為您提供開始使用心理測量學方法所需的一切,包括因子分析(fafa.parallelprincipal)、項目聚類(ICLUST和相關方法)、Cronbach’s alpha ( alpha);William Revelle 的網站上有一個很好的概述,尤其是An Introduction to Psychometric theory with applications in R
  • psy,還包括碎石圖(通過 PCA + 模擬數據集)可視化 ( scree.plot) 和 MTMM ( mtmm)。

參考

  1. Campbell, DT 和 Fiske, DW (1959)。通過多特徵多方法矩陣進行收斂和判別驗證。心理公報,56:81-105。
  2. Hays, RD 和 Fayers, P. (2005)。評估多項目量表。在評估臨床試驗中的生活質量,(Fayers, P. 和 Hays, R., Eds.),第 41-53 頁。牛津。
  3. Revelle, W. (1979)。層次聚類分析和測試的內部結構。多元行為研究,14:57-74。

引用自:https://stats.stackexchange.com/questions/9918

comments powered by Disqus