Machine-Learning
遠程監督:監督、半監督還是兩者兼而有之?
“遠程監督”是一種學習方案,其中在給定弱標記訓練集的情況下學習分類器(訓練數據根據啟發式/規則自動標記)。我認為,如果它們的標記數據是啟發式/自動標記的,那麼監督學習和半監督學習都可以包括這種“遠程監督”。但是,在這個頁面中,“遠程監督”被定義為“半監督學習”(即,僅限於“半監督”)。
所以我的問題是,**“遠程監管”是指半監管嗎?**在我看來,它可以應用於監督學習和半監督學習。如果有,請提供任何可靠的參考資料。
遠程監督算法通常具有以下步驟:
1] 它可能有一些標記的訓練數據
2] 它“有權”訪問未標記的數據池
3] 它有一個操作員,允許它從這些未標記的數據中採樣並標記它們並且該算子在其標籤中預計會產生噪音
4] 該算法然後集體利用原始標記的訓練數據(如果有的話)和這個新的嘈雜標記的數據來給出最終輸出。
現在,要回答您的問題,您和網站都是正確的。您正在查看算法的第 4 步,並註意到在第 4 步可以使用用戶可以訪問的任何算法。因此,您的觀點是,“它可以應用於監督學習和半監督學習”。
而該站點正在共同查看所有步驟 1-4 並註意到嘈雜標記的數據是從未標記數據池中獲得的(使用或不使用一些預先存在的標記訓練數據)以及獲取嘈雜標籤的過程是任何遠程監督算法的重要組成部分,因此它是一種半監督算法。