半監督學習中的流形假設是什麼?
我試圖弄清楚流形假設在半監督學習中的含義。誰能用簡單的方式解釋一下?我無法理解它背後的直覺。
它表示您的數據位於嵌入在高維空間中的低維流形上。我沒明白那是什麼意思。
想像一下,您將一束種子固定在玻璃板上,玻璃板上水平放置在桌子上。由於我們通常考慮空間的方式,可以肯定地說這些種子或多或少地生活在二維空間中,因為每個種子都可以通過兩個數字來識別,這兩個數字給出了該種子在地球表面上的坐標玻璃。
現在想像你拿起盤子,將它斜向上傾斜,這樣玻璃的表面就不再與地面水平了。現在,如果你想找到其中一顆種子,你有幾個選擇。如果您決定忽略玻璃,那麼每個種子似乎都漂浮在桌子上方的三維空間中,因此您需要使用三個數字來描述每個種子的位置,每個空間方向一個。但是僅僅通過傾斜玻璃,你並沒有改變種子仍然生活在二維表面上的事實。因此,您可以描述玻璃表面如何位於三維空間中,然後您可以使用原始二維空間描述玻璃上種子的位置。
在這個思想實驗中,玻璃表麵類似於存在於高維空間中的低維流形:無論你如何在三個維度上旋轉板,種子仍然沿著二維平面的表面存在。
例子
更一般地說,嵌入在高維空間中的低維流形只是一組點,無論出於何種原因,這些點都被認為是連接的或同一組的一部分。值得注意的是,歧管在高維空間中可能會以某種方式扭曲(例如,玻璃表面可能會扭曲成碗狀而不是板狀),但歧管仍然基本上是低維的。尤其是在高維空間中,這個流形可以有很多不同的形式和形狀,但是因為我們生活在一個三維世界中,很難想像有超過三個維度的例子。但是,作為示例,請考慮以下示例:
- 物理空間(三維)中的一塊玻璃(平面,二維)
- 一塊織物(二維)中的一根線(一維)
- 一塊織物(二維)在洗衣機裡弄皺(三維)
機器學習中流形的常見示例(或至少假設為沿著低維流形存在的集合)包括:
- 自然場景的圖像(例如,通常您看不到白噪聲圖像,這意味著“自然”圖像不會佔據可能的像素配置的整個空間)
- 自然的聲音(類似的論點)
- 人體運動(人體有數百個自由度,但運動似乎生活在一個可以使用約 10 個維度有效表示的空間中)
學習流形
機器學習中的多種假設是,與其假設世界上的數據可能來自可能空間的每個部分(例如,所有可能的 1 兆像素圖像的空間,包括白噪聲),不如假設更有意義訓練數據來自相對低維的流形(如帶有種子的玻璃板)。那麼學習流形的結構就成了一項重要的任務;此外,在不使用標記訓練數據的情況下,這種學習任務似乎是可能的。
學習低維流形的結構有很多很多不同的方法。最廣泛使用的方法之一是 PCA,它假設流形由嵌入在更高維空間中的單個橢圓形“斑點”組成,如煎餅或雪茄形狀。更複雜的技術(如 isomap、ICA 或稀疏編碼)以各種方式放寬了其中一些假設。
半監督學習
流形假設在半監督學習中很重要的原因有兩個。對於許多實際任務(例如,確定圖像中的像素是顯示 4 還是 5),世界上沒有標籤(例如,其中可能有數字的圖像)比有標籤(例如,明確標記為“4”或“5”的圖像)。此外,圖像像素中的可用信息比具有標籤的圖像的標籤中的信息多許多數量級。但是,就像我上面描述的那樣,自然圖像實際上並不是從像素配置上的均勻分佈中採樣的,因此似乎有一些流形可以捕獲自然圖像的結構。流形,雖然包含 5 的圖像同樣位於不同但附近的流形上,但我們可以嘗試僅使用像素數據為這些流形中的每一個開發表示,希望不同的流形將使用數據的不同學習特徵來表示。然後,稍後,當我們有一些可用的標籤數據時,我們可以使用這些位簡單地將標籤應用於已經識別的流形。
這種解釋大部分來自深度和特徵學習文獻中的工作。Yoshua Bengio和Yann LeCun——參見基於能量的學習教程,在這方面有特別容易理解的論點。