R knncat是否规范化数据?

时间:2017-03-26 11:06:12

标签: r knn

我正在对一些数据进行分析。我有分类(超过2个因素)和连续数据。我发现了一个解决这种情况的软件包(knncat),但是很少有文档说明它是如何工作的。

我希望使用交叉验证(我认为可以通过简单地不提供培训数据来完成)并且我遇到了一个问题。我不知道这些软件包如何规范化数据。我不知道在使用之前是否应该对数字数据进行标准化,或者我应该保持原样。

有谁知道knncat如何处理这个?或者是否有人能够推荐一种更好的方法或包来处理带有分类和数字数据的KNN?

1 个答案:

答案 0 :(得分:1)

  1. 检查函数正在执行的操作的最佳方法是查看函数内部 身体,你可以用:

    getAnywhere(knncat)

    据我所知,那里的数据没有缩放或居中。

    1. 关于第二个问题,处理分类数据的方法是 创建虚拟变量(knncat实际上是这样做的)。但是你 可以自己创建虚拟变量。

      例如,

      data$cat.var.dummy <- as.integer(as.factor(data$cat.var))
      

      或者您可以使用Caret包,其中包含方法 好吧,dummyVars