我有一个大型数据集(超过300000个值),并且使用stats.gaussian_kde为它创建了一个PDF,如下所示:
kernel=scipy.stats.gaussian_kde(vals)
ind=np.linspace(np.min(vals), np.max(vals),1000)
PDE=kernel.evaluate(ind)
现在,我想从此pdf生成新的随机值,但是我不确定该怎么做。有人有例子吗?
答案 0 :(得分:1)
使用resample方法。
vals = [1,2,3,4,5]
kernel = scipy.stats.gaussian_kde(vals)
my_random_vals = kernel.resample(size=10)
print(my_random_vals)
[[ 2.18467151 -1.22069121 2.64074108 0.32268845 2.78022227 6.29483273
1.94848359 4.79865993 1.30363424 3.71441989]]