Question

我正在使用LibSVM在高度不平衡的数据集上训练SVM。 10％的输出为真，而90％为假。我读到了重量参数：

  -wi weight: set the parameter C of class i to weight*C, for C-SVC (default 1)

每个类的参数设置应该是什么？这个权重参数的直观含义是什么？我们应该如何使用它？

Answer 1

权重参数控制SVM优化的偏差。也就是说，体重较高的课程会更多。如果一个类的权重是另一个类的3倍，那么较低权重类的实例可以是libsvm确定为另一个类的实例的类之间的边界的3倍。同样的优化价值。

你如何使用它完全取决于你 - 你可以设置它使得两个类具有相同的权重（即真实的权重为9），但如果你得到的结果实际上改善了使用它权重是另一回事。

我建议你玩不同的重量来看看会发生什么。