Pca

好的 PCA 教學示例?

  • December 8, 2013

我正在向一類工程師、社會科學家和計算機程序員教授線性代數。我們剛剛做了奇異值分解,我們有額外的一天,所以我想我會談談奇異值分解和主成分分析之間的關係。我把講座的理論部分寫得很好,但我發現很難找到好的例子來使用。以下是約束:

  • 我想展示圖片。理想情況下,圖形本身應該可以很好地工作:散點圖中的軸和數據點應該被標記。英文單詞比拉丁物種名稱好。
  • 正在研究的問題應該很有趣。尼日利亞魚的形態雖然很重要,但並不是吸引班級註意力的好方法。
  • 與前面的要點相反:沒有關於人類種族差異的內容;智力測試什麼的都沒有。這將引發一場與數學技術無關的熱烈討論。
  • 數學分析方法應該基本上是純PCA。DW-NOMINATE 項目雖然很棒,但它使用 PCA 作為起點,然後是更複雜的爬山算法。

我認為這很容易。如果我有時間收集數據,我可以很容易地想到十幾個有趣的分析項目:參加皮尤研究中心的民意調查,看看 PCA 是否恢復了自由主義者鍾愛的社會政策/財政政策軸心。對典型的犬種物理特徵進行十幾個測量,看看 PCA 是否能找到“牧羊犬”集群。等等,等等……我正在尋找其他已經完成這項工作的人,以便我可以炫耀一下。

Shalizi 的筆記中有一些分步指南:http: //www.stat.cmu.edu/~cshalizi/uADA/12/lectures/ch18.pdf,一個是來自 R 的汽車數據集,另一個是紐約時報的藝術和音樂文章。(從文章中包含的單詞推斷主題是一個非常活躍的研究領域。)如果您不知道/不想學習 R,那麼您仍然可以使用他的筆記和圖形。

編輯:忘了說 Everitt 和 Hothorn 的書中也有幾個很好的例子,可以在 SpringerLink 上找到。我記得,一個數據集是噴氣式戰鬥機,還有羅馬陶器。

引用自:https://stats.stackexchange.com/questions/78990

comments powered by Disqus