LibSVM中的标称属性

时间:2010-04-03 03:36:32

标签: artificial-intelligence machine-learning svm libsvm

创建libsvm培训文件时,如何区分名义属性与数字属性?我试图将某些名义属性编码为整数,但我想确保libsvm不会将它们误解为数值。不幸的是,libsvm的网站似乎只有很少的文档。 Pentaho's docs似乎暗示libsvm会做出这种区分,但我仍然不清楚它是如何制作的。

2 个答案:

答案 0 :(得分:9)

不要这样做 I'm trying to encode certain nominal attributes as integers

相反,对每个名义属性的每个值使用单独的二进制特征。

SVM的制定方式,所有属性/特征都是数字,类标签是名义上的。标称属性基本上是通过使用互斥的二进制特征伪造的。

答案 1 :(得分:0)

我认为你不能在libsvm,weka或SVM-light中这样做。您可以使用的一种方法是为您的名义属性使用类似决策树的内容,为数字属性使用svm或任何基于距离的分类器,然后合并结果。我希望它有所帮助。