“隨機投影”嚴格來說不是投影嗎?
隨機投影算法的當前實現通過將數據樣本映射到 Rd 到 Rk 用一個 d×k 投影矩陣 R 其條目來自合適的分佈(例如來自 N(0,1) ):
x′=1√kxR
方便的是,存在理論證明表明該映射近似地保留了成對距離。
然而,最近我發現這些註釋,作者聲稱這種與隨機矩陣的映射不是嚴格線性代數意義上的投影(第 6 頁)。從那裡給出的解釋來看,這是因為 R 當其條目獨立地從 N(0,1) . 因此,RP 的早期版本中的列的正交性 R 被強制執行可以被視為一種預測。
您能否提供更詳細的解釋:(1)嚴格意義上的投影定義是什麼,以及(2)為什麼 RP 不是這個定義下的投影?
- 在這個嚴格的(線性代數)意義上(這個詞的)投影的定義是什麼
https://en.wikipedia.org/wiki/Projection_(linear_algebra)
在線性代數和泛函分析中,投影是一種線性變換 P 從向量空間到自身,使得 P2=P . 也就是說,每當 P 對任何值應用兩次,它給出的結果與應用一次相同(冪等)。
對於正交投影或矢量投影,您有
https://en.wikipedia.org/wiki/Projection_(linear_algebra)
正交投影是范圍 U 和零空間 V 是正交子空間的投影。
- 為什麼 RP 在這個定義下不是一個投影?
Michael Mahoney 在您的講義中寫道,這取決於 RP 的構造方式,RP 是否是傳統線性代數意義上的投影。他在第三點和第四點這樣做:
第三,如果隨機向量是完全正交的(因為它們實際上是在原始的 JL 構造中),那麼我們會認為 JL 投影是正交投影
…
但儘管這對高斯人來說是錯誤的, {±} 隨機變量和大多數其他構造,可以證明得到的向量近似為單位長度且近似正交
…
這“足夠好”。
因此,原則上,您可以使用僅限於正交矩陣的不同結構進行隨機投影(儘管不需要)。例如看原作:
約翰遜、威廉 B. 和喬拉姆·林登施特勞斯。“將 Lipschitz 映射擴展到 Hilbert 空間。” 當代數學 26.189-206(1984):1。
…如果一個人隨機選擇一個等級 k 正交投影 ln2
…
為了準確起見,我們讓 Q 投影到第一個 k 坐標 ln2 然後讓 σ 歸一化 Haar 測量 O(n) , 上的正交群 ln2 . 那麼隨機變量f:(O(n),σ)→L(ln2)
被定義為f(u)=U⋆QU確定“隨機等級”的概念 k 投影。”維基百科條目以這種方式描述了隨機投影(第 10 頁和第 11 頁的講義中也提到了這一點)
https://en.wikipedia.org/wiki/Random_projection#Gaussian_random_projection
第一行是一個隨機單位向量,從 Sd−1 . 第二行是來自與第一行正交的空間的隨機單位向量,第三行是來自與前兩行正交的空間的隨機單位向量,依此類推。
但是,當您採用正態分佈的矩陣隨機變量和自變量中的所有矩陣條目時,通常不會得到這種正交性(正如 Whuber 在他的評論中提到的一個非常簡單的結果“如果列總是正交的,它們的條目可以不獨立”)。
矩陣 R 和在正交列的情況下的乘積,可以看作是一個投影,因為它與一個投影矩陣有關 P=RTR . 這與將普通最小二乘回歸視為投影有點相同。產品 b=RTx 不是投影,但它為您提供了不同基向量中的坐標。“真實”的投影是 x′=Rb=RTRx ,投影矩陣為 RTR .
投影矩陣 P=RTR 需要是子空間上的恆等運算符 U 那是投影的範圍(請參閱維基百科頁面上提到的屬性)。或者換句話說,它需要具有特徵值 1 和 0,這樣它作為單位矩陣的子空間就是與特徵值 1 相關聯的特徵向量的跨度。使用隨機矩陣條目,您將不會獲得此屬性。這是講義中的第二點
…它在很多方面“看起來”像一個正交矩陣 … range(PTP) 是一個均勻分佈的子空間……但特徵值不在 {0,1} .
請注意,在此引用中,矩陣 P 與矩陣有關 R 在問題中而不是在投影矩陣中 P=RTR 由矩陣隱含 R
因此,不同結構的隨機投影,例如在矩陣中使用隨機條目,並不完全等於正交投影。但它在計算上更簡單,而且根據 Michael Mahoney 的說法,它*“足夠好”。*