Clustering

有監督的聚類或分類?

  • September 19, 2012

第二個問題是我在網上某處討論“監督聚類”時發現,據我所知,聚類是無監督的,那麼“監督聚類”背後的確切含義是什麼?“分類”有什麼區別?

有很多鏈接在談論這個:

http://www.cs.uh.edu/docs/cosc/technical-reports/2005/05_10.pdf

http://books.nips.cc/papers/files/nips23/NIPS2010_0427.pdf

http://engr.case.edu/ray_soumya/mlrg/supervised_clustering_finley_joachims_icml05.pdf

http://www.public.asu.edu/~kvanlehn/Stringent/PDF/05CICL_UP_DB_PWJ_KVL.pdf

http://www.machinelearning.org/proceedings/icml2007/papers/366.pdf

http://www.cs.cornell.edu/~tomf/publications/supervised_kmeans-08.pdf

http://jmlr.csail.mit.edu/papers/volume6/daume05a/daume05a.pdf

等等 …

我天真的理解是,分類是在您有一組指定的類並且您希望將新事物/數據集分類到這些指定類中的一個時執行的。

或者,集群沒有任何開始,您使用所有數據(包括新數據)來分成集群。

兩者都使用距離度量來決定如何聚類/分類。不同之處在於分類基於先前定義的一組類,而聚類基於整個數據決定集群。

我再次天真的理解是,監督聚類仍然基於整個數據進行聚類,因此將是聚類而不是分類。

實際上,我確信聚類和分類背後的理論是相互關聯的。

引用自:https://stats.stackexchange.com/questions/37587

comments powered by Disqus