algorithm - K近邻算法的分类 - Thinbug

K近邻算法的分类

时间：2018-06-01 06:46:24

标签： algorithm knn

x和y轴在此散点图中具有不同的比例。假设每个形状的中心是数据点。

问：使用此训练集对9最近邻分类器的测试点进行分类，使用这两种功能？

问：在页面顶部的散点图中，按任意顺序，将左下角未知点的三个最近邻居的类命名为，使用这两个特征来计算距离。

这是我的尝试：

1：在这种情况下，K越高，每个预测中的选民越多，因此对异常值的抵抗力越强。较大的K值将具有更平滑的决策边界来决定Pet或Wild，这意味着方差更小但偏差更大。

2：通过使用毕达哥拉斯定理，三个最近的类到左下方未知点的距离是，

宠物，距离= 0.02
宠物，距离= 2.20
野性，距离= 2.60

因此，该课程为Pet。

1 个答案:

答案 0 :(得分：1)

问题1询问您未提供的具体答案（宠物或野生）。您所做的陈述通常是正确的，但他们实际上并没有回答这个问题。请注意，只有4个Pet点，其余为Wild。所以无论哪个9点是最近的邻居，至少有5个（大多数）是Wild。因此，K = 9的KNN分类器将始终使用此数据预测Wild。

问题2看起来大多是正确的。我没有准确的坐标坐标，但你的数字似乎在正确的球场，除了你可能在第一个距离有一个拼写错误。这些类是正确的，结果预测（问题没有明确要求）也是正确的（假设K = 3）。