WEKA LibSVM重量参数为成本

时间:2012-08-01 17:02:47

标签: machine-learning data-mining weka svm libsvm

我正在使用LibSVM在高度不平衡的数据集上训练SVM。 10%的输出为真,而90%为假。我读到了重量参数:

  -wi weight: set the parameter C of class i to weight*C, for C-SVC (default 1)

每个类的参数设置应该是什么?这个权重参数的直观含义是什么?我们应该如何使用它?

1 个答案:

答案 0 :(得分:4)

权重参数控制SVM优化的偏差。也就是说,体重较高的课程会更多。如果一个类的权重是另一个类的3倍,那么较低权重类的实例可以是libsvm确定为另一个类的实例的类之间的边界的3倍。同样的优化价值。

你如何使用它完全取决于你 - 你可以设置它使得两个类具有相同的权重(即真实的权重为9),但如果你得到的结果实际上改善了使用它权重是另一回事。

我建议你玩不同的重量来看看会发生什么。

相关问题