Self-Study
Jaccard Similarity - 來自數據挖掘書 - 作業問題
練習 3.1.3:假設我們有一個包含 n 個元素的全集 U,我們隨機選擇兩個子集 S 和 T,每個子集包含 n 個元素中的 m 個。
S 和 T 的 Jaccard 相似度的期望值是多少?
T 中的每個項目都有一個也屬於 S 的機會。因此,S & T 共有的項目的預期數量是.
經驗。(簡化後。)