应用错误收集

如何在K最近邻居中选择正确的k值

时间：2018-07-06 14:45:33

标签： python-3.x machine-learning classification knn

我有一个包含9448个数据点（行）的数据集每当我选择介于1到10之间的K值时，精度就会达到100％（这是当然的理想情况！）并且更奇怪。

如果我选择K值为100或更高，则准确度会逐渐降低（95％至90％）。

如何选择K的值？我们想要一个像样的准确性，而不是100％的假设

1 个答案:

答案 0 :(得分：1)

嗯，选择k的简单方法是sqrt（数据点数）。在这种情况下，它将是sqrt（9448）= 97.2〜97。并且请记住，在不查看数据的情况下说出哪个k值最合适是不合适的。如果训练相似类的样本形成聚类，则使用从1到10的k值将获得良好的准确性。如果数据是随机分布的，则无法说出哪个k值将提供最佳结果。在这种情况下，您需要通过经验分析来找到它。

使用相同数据集的K-最近邻密度估计，k = 5
k mysql中的最近邻
使用交叉验证为k-最近邻分类器找到正确的k值
K最近邻
获得最短的K＆＃39; K-Nearest算法（Java）中的距离
k最近的邻居**在球体上**
受约束的k最近邻居实现
在PAM中选择正确的“K”值
如何在K最近邻居中选择正确的k值
k个最近邻居的复杂度

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？