“隨機投影”嚴格來說不是投影嗎？

December 14, 2018

隨機投影算法的當前實現通過將數據樣本映射到 $ \mathbb R^d $ 到 $ \mathbb R^k $ 用一個 $ d\times k $ 投影矩陣 $ R $ 其條目來自合適的分佈（例如來自 $ \mathcal N(0,1) $ ):

$ x^\prime = \frac{1}{\sqrt k}xR $

方便的是，存在理論證明表明該映射近似地保留了成對距離。

然而，最近我發現這些註釋，作者聲稱這種與隨機矩陣的映射不是嚴格線性代數意義上的投影（第 6 頁）。從那裡給出的解釋來看，這是因為 $ R $ 當其條目獨立地從 $ \mathcal N(0,1) $ . 因此，RP 的早期版本中的列的正交性 $ R $ 被強制執行可以被視為一種預測。

您能否提供更詳細的解釋：（1）嚴格意義上的投影定義是什麼，以及（2）為什麼 RP 不是這個定義下的投影？

在這個嚴格的（線性代數）意義上（這個詞的）投影的定義是什麼

https://en.wikipedia.org/wiki/Projection_(linear_algebra)

在線性代數和泛函分析中，投影是一種線性變換 $ P $ 從向量空間到自身，使得 $ P^2 = P $ . 也就是說，每當 $ P $ 對任何值應用兩次，它給出的結果與應用一次相同（冪等）。

對於正交投影或矢量投影，您有

https://en.wikipedia.org/wiki/Projection_(linear_algebra)

正交投影是范圍 U 和零空間 V 是正交子空間的投影。

為什麼 RP 在這個定義下不是一個投影？

Michael Mahoney 在您的講義中寫道，這取決於 RP 的構造方式，RP 是否是傳統線性代數意義上的投影。他在第三點和第四點這樣做：

第三，如果隨機向量是完全正交的（因為它們實際上是在原始的 JL 構造中），那麼我們會認為 JL 投影是正交投影

…

但儘管這對高斯人來說是錯誤的， $ \lbrace \pm \rbrace $ 隨機變量和大多數其他構造，可以證明得到的向量近似為單位長度且近似正交

…

這“足夠好”。

因此，原則上，您可以使用僅限於正交矩陣的不同結構進行隨機投影（儘管不需要）。例如看原作：

約翰遜、威廉 B. 和喬拉姆·林登施特勞斯。“將 Lipschitz 映射擴展到 Hilbert 空間。” 當代數學 26.189-206（1984）：1。

…如果一個人隨機選擇一個等級 $ k $ 正交投影 $ l_2^n $

…

為了準確起見，我們讓 $ Q $ 投影到第一個 $ k $ 坐標 $ l_2^n $ 然後讓 $ \sigma $ 歸一化 Haar 測量 $ O(n) $ , 上的正交群 $ l_2^n $ . 那麼隨機變量$$ f: (O(n), \sigma) \to L(l_2^n) $$被定義為$$ f(u) = U^\star Q U $$確定“隨機等級”的概念 $ k $ 投影。”

維基百科條目以這種方式描述了隨機投影（第 10 頁和第 11 頁的講義中也提到了這一點）

https://en.wikipedia.org/wiki/Random_projection#Gaussian_random_projection

第一行是一個隨機單位向量，從 $ S^{d − 1} $ . 第二行是來自與第一行正交的空間的隨機單位向量，第三行是來自與前兩行正交的空間的隨機單位向量，依此類推。

但是，當您採用正態分佈的矩陣隨機變量和自變量中的所有矩陣條目時，通常不會得到這種正交性（正如 Whuber 在他的評論中提到的一個非常簡單的結果“如果列總是正交的，它們的條目可以不獨立”）。

矩陣 $ R $ 和在正交列的情況下的乘積，可以看作是一個投影，因為它與一個投影矩陣有關 $ P = R^TR $ . 這與將普通最小二乘回歸視為投影有點相同。產品 $ b = R^T x $ 不是投影，但它為您提供了不同基向量中的坐標。“真實”的投影是 $ x' = Rb = R^TRx $ ，投影矩陣為 $ R^TR $ .

投影矩陣 $ P=R^TR $ 需要是子空間上的恆等運算符 $ U $ 那是投影的範圍（請參閱維基百科頁面上提到的屬性）。或者換句話說，它需要具有特徵值 1 和 0，這樣它作為單位矩陣的子空間就是與特徵值 1 相關聯的特徵向量的跨度。使用隨機矩陣條目，您將不會獲得此屬性。這是講義中的第二點

…它在很多方面“看起來”像一個正交矩陣 … $ range(P^T P) $ 是一個均勻分佈的子空間……但特徵值不在 $ \lbrace 0, 1 \rbrace $ .

請注意，在此引用中，矩陣 $ P $ 與矩陣有關 $ R $ 在問題中而不是在投影矩陣中 $ P = R^TR $ 由矩陣隱含 $ R $

因此，不同結構的隨機投影，例如在矩陣中使用隨機條目，並不完全等於正交投影。但它在計算上更簡單，而且根據 Michael Mahoney 的說法，它*“足夠好”。*