Random-Variable

如何生成隨機分類數據?

  • August 11, 2011

假設我有一個分類變量,可以取值 A、B、C 和 D。如何生成 10000 個隨機數據點並控制每個數據點的頻率?例如:

A = 10% B = 20% C = 65% D = 5%

任何想法我怎麼能做到這一點?

您是否希望樣本中的比例與所述比例完全相同?還是代表從具有這些比例的非常大的人口中抽樣的想法(因此樣本比例將接近但不准確)?

如果您想要精確的比例,那麼您可以按照 Brandon 的建議並使用 Rsample函數來隨機化具有精確比例的向量的順序。

如果你想從總體中抽樣,但不限制比例是準確的,那麼你仍然可以使用sampleR 中的函數,prob參數如下:

> x <- sample( LETTERS[1:4], 10000, replace=TRUE, prob=c(0.1, 0.2, 0.65, 0.05) )
> prop.table(table(x))
x
    A      B      C      D 
0.0965 0.1972 0.6544 0.0519 

引用自:https://stats.stackexchange.com/questions/14158

comments powered by Disqus

相關問答