用Epsilon进行过采样

时间:2013-03-31 08:10:27

标签: algorithm machine-learning artificial-intelligence classification

我对数据挖掘有疑问。我有一个74个实例的数据集,属于4个类。由于每个类的数量不足以使用某些分类器(svm,rna,knn)获得良好的准确性,我需要“过采样”每个类的实例数。

我听说有一种方法可以做到这一点。它包括生成这些新实例,如下所示:

new_instance <---- original_instance + u(epsilon)

但我对此并不了解。

是否有人使用此方法“过采样”他的数据?

1 个答案:

答案 0 :(得分:0)

我从未使用过这种过采样方法,但我认为你可以找到有用的指针in this paper

描述了几种过采样和欠采样。它应该可以帮助您找到适合您案例的更合适的方法。