如何在数据集中查找值的分布并根据此分布生成随机值?

时间:2012-08-03 11:13:40

标签: statistics distribution

我有100个案例的数据集。每个案例都有一个{I,II,III,IV,V}类和一个值A和V,每个类在数据集中只出现20次:

Class   A   V
5       2   3
1       3   5
3       2   3
2       3   5
3       2   3
1       2   4
1       2   4
1       4   4
2       3   3
2       3   4

我想基于这个集合生成另外100个案例。我认为我应该

是正确的
  1. 找出A的分布和每个类的V分布?
  2. 计算A& A的联合分布每班V
  3. 根据此联合分布获取随机数
  4. 如果是这样,那么欢迎任何指向java或python中的应用程序或库的指针!

1 个答案:

答案 0 :(得分:0)

当我想在数据集中找到值的分布时,我使用R中的包rriskDistributions。这个包为用户提供了一个GUI,允许在不了解R语法的情况下选择最合适的分布。

rriskDistributions PDF

相关问题