Pca

如何從對人們感興趣的領域的調查中解釋這個 PCA 雙圖?

  • June 8, 2013

**背景:**在我的調查中,我向數百名參與者詢問了他們對選定領域的興趣程度(採用五點李克特量表,1 表示“不感興趣”,5 表示“感興趣”)。

然後我嘗試了 PCA。下圖是前兩個主要成分的投影。顏色用於性別,PCA 箭頭是原始變量(即興趣)。

我注意到:

  • 點(受訪者)被第二個組件很好地分開。
  • 沒有留下任何箭頭。
  • 有些箭頭比其他箭頭短得多。
  • 變量往往會形成集群,而不是觀察。
  • 似乎向下(指向男性)的箭頭主要是男性的興趣,而向上的箭頭主要是女性的興趣。
  • 有些箭頭既不向下也不向上。

**問題:**如何正確解釋點(受訪者)、顏色(性別)和箭頭(變量)之間的關係?從這個情節中可以挖掘出關於受訪者及其興趣的其他哪些結論?

數據可以在這裡找到。

PCA分析

點是受訪者,顏色是性別。這個,你知道的。您繪圖的主軸代表第一個和第二個 PC 分數,並在此基礎上繪製個人。左下象限的某個人在這兩個方面都得分低。PC2 似乎標記了“男性”和“女性”的興趣。我不知道 PC1 是什麼意思,但它可能代表了一個整體的興趣得分——有很多興趣的人得分高。或者它可能代表有強烈興趣的人(5 分)。

向量是原始變量的投影坐標系。因此,如果你將一個點垂直投影到閱讀向量上——你應該得到那個人的閱讀分數。相對位置在這裡很重要。

以“腎上腺素運動”之類的“男性”向量為例。現在想像你從右上象限的高處投射一個粉紅色的點。該人對“腎上腺素運動”的坐標將是負面的。

那麼為什麼箭頭都在圖表的右半邊呢?給定幾何形狀,一個人在圖的左側越深,他們的正數預測就越少。這表明 PC1 是衡量整體興趣水平的指標。

我不確定你還能在這裡學到什麼。你可能想看看 PC3 和 PC4,如果 PC1 和 PC2 只告訴你有些人比其他人有更多的興趣,並且男性與女性不同。

您的情節似乎幾乎圍繞 PC1 軸對稱,並且關於性別對稱。與女性對男性的興趣一樣多的男人對女性感興趣……或者這是真的嗎?我只是在看點。查看地圖不對稱的區域可能會很有趣:PC1 大,PC2 適度負向——該部門有很多活動。為什麼?

引用自:https://stats.stackexchange.com/questions/61215

comments powered by Disqus