Random-Variable
如何生成隨機分類數據?
假設我有一個分類變量,可以取值 A、B、C 和 D。如何生成 10000 個隨機數據點並控制每個數據點的頻率?例如:
A = 10% B = 20% C = 65% D = 5%
任何想法我怎麼能做到這一點?
您是否希望樣本中的比例與所述比例完全相同?還是代表從具有這些比例的非常大的人口中抽樣的想法(因此樣本比例將接近但不准確)?
如果您想要精確的比例,那麼您可以按照 Brandon 的建議並使用 R
sample
函數來隨機化具有精確比例的向量的順序。如果你想從總體中抽樣,但不限制比例是準確的,那麼你仍然可以使用
sample
R 中的函數,prob
參數如下:> x <- sample( LETTERS[1:4], 10000, replace=TRUE, prob=c(0.1, 0.2, 0.65, 0.05) ) > prop.table(table(x)) x A B C D 0.0965 0.1972 0.6544 0.0519