如何使用R

时间:2018-03-23 15:30:36

标签: r knn

我有一个具有以下结构的数据集:

Number of Rows = 1000

每一行对应一篇文章

Number of Columns = 502

Column 1 : Title of the article
Column 2 : Text of the article
From column  3 to column 502 : Each column corresponds to a unique word appearing in the corpus of all the articles in the data set and gives the count of this word in the article 

鉴于来自上述数据集的单篇文章的标题,问题是使用k-最近邻居算法在内容方面找到10篇与其最接近的文章。 我可以从头开始实现这个算法,但我想在R中使用内置函数。  knn https://stat.ethz.ch/R-manual/R-devel/library/class/html/knn.html的R文档似乎是用于监督学习 请解释如何在这种情况下使用它,这实际上是无监督学习的情况

0 个答案:

没有答案