Terminology

“隨機投影”嚴格來說不是投影嗎?

  • December 14, 2018

隨機投影算法的當前實現通過將數據樣本映射到 RdRk 用一個 d×k 投影矩陣 R 其條目來自合適的分佈(例如來自 N(0,1) ):

x=1kxR

方便的是,存在理論證明表明該映射近似地保留了成對距離。

然而,最近我發現這些註釋,作者聲稱這種與隨機矩陣的映射不是嚴格線性代數意義上的投影(第 6 頁)。從那裡給出的解釋來看,這是因為 R 當其條目獨立地從 N(0,1) . 因此,RP 的早期版本中的列的正交性 R 被強制執行可以被視為一種預測。

您能否提供更詳細的解釋:(1)嚴格意義上的投影定義是什麼,以及(2)為什麼 RP 不是這個定義下的投影?

  1. 在這個嚴格的(線性代數)意義上(這個詞的)投影的定義是什麼

https://en.wikipedia.org/wiki/Projection_(linear_algebra)

在線性代數和泛函分析中,投影是一種線性變換 P 從向量空間到自身,使得 P2=P . 也就是說,每當 P 對任何值應用兩次,它給出的結果與應用一次相同(冪等)。

對於正交投影或矢量投影,您有

https://en.wikipedia.org/wiki/Projection_(linear_algebra)

正交投影是范圍 U 和零空間 V 是正交子空間的投影。

  1. 為什麼 RP 在這個定義下不是一個投影?

Michael Mahoney 在您的講義中寫道,這取決於 RP 的構造方式,RP 是否是傳統線性代數意義上的投影。他在第三點和第四點這樣做:

第三,如果隨機向量是完全正交的(因為它們實際上是在原始的 JL 構造中),那麼我們會認為 JL 投影是正交投影

但儘管這對高斯人來說是錯誤的, {±} 隨機變量和大多數其他構造,可以證明得到的向量近似為單位長度且近似正交

這“足夠好”。

因此,原則上,您可以使用僅限於正交矩陣的不同結構進行隨機投影(儘管不需要)。例如看原作:

約翰遜、威廉 B. 和喬拉姆·林登施特勞斯。“將 Lipschitz 映射擴展到 Hilbert 空間。” 當代數學 26.189-206(1984):1。

…如果一個人隨機選擇一個等級 k 正交投影 ln2

為了準確起見,我們讓 Q 投影到第一個 k 坐標 ln2 然後讓 σ 歸一化 Haar 測量 O(n) , 上的正交群 ln2 . 那麼隨機變量f:(O(n),σ)L(ln2)

被定義為f(u)=UQU
確定“隨機等級”的概念 k 投影。”

維基百科條目以這種方式描述了隨機投影(第 10 頁和第 11 頁的講義中也提到了這一點)

https://en.wikipedia.org/wiki/Random_projection#Gaussian_random_projection

第一行是一個隨機單位向量,從 Sd1 . 第二行是來自與第一行正交的空間的隨機單位向量,第三行是來自與前兩行正交的空間的隨機單位向量,依此類推。

但是,當您採用正態分佈的矩陣隨機變量和自變量中的所有矩陣條目時,通常不會得到這種正交性(正如 Whuber 在他的評論中提到的一個非常簡單的結果“如果列總是正交的,它們的條目可以不獨立”)。

矩陣 R 和在正交列的情況下的乘積,可以看作是一個投影,因為它與一個投影矩陣有關 P=RTR . 這與將普通最小二乘回歸視為投影有點相同。產品 b=RTx 不是投影,但它為您提供了不同基向量中的坐標。“真實”的投影是 x=Rb=RTRx ,投影矩陣為 RTR .

投影矩陣 P=RTR 需要是子空間上的恆等運算符 U 那是投影的範圍(請參閱維基百科頁面上提到的屬性)。或者換句話說,它需要具有特徵值 1 和 0,這樣它作為單位矩陣的子空間就是與特徵值 1 相關聯的特徵向量的跨度。使用隨機矩陣條目,您將不會獲得此屬性。這是講義中的第二點

…它在很多方面“看起來”像一個正交矩陣 … range(PTP) 是一個均勻分佈的子空間……但特徵值不在 {0,1} .

請注意,在此引用中,矩陣 P 與矩陣有關 R 在問題中而不是在投影矩陣中 P=RTR 由矩陣隱含 R

因此,不同結構的隨機投影,例如在矩陣中使用隨機條目,並不完全等於正交投影。但它在計算上更簡單,而且根據 Michael Mahoney 的說法,它*“足夠好”。*

引用自:https://stats.stackexchange.com/questions/381991