如何有效地找到条件K最近邻

时间:2019-05-11 05:24:50

标签: python knn

我有两个数据集(培训和测试),都具有以下3列格式:

纬度,经度,年

我正在尝试从测试集中为测试集中的每个测试样本找到前5名邻居。但是,这里的条件是每个顶级邻居的年份值必须小于测试样本。

如果对于每个测试样本,我都是先根据年份进行训练集选择,然后再进行KNN,则可能会太慢。

我现在正在考虑使用非常大的K值对训练集中的每个测试样本进行KNN查找,首先找到其索引,然后验证其年份小于测试样本的年份。

还有更好的主意或示例代码吗?

0 个答案:

没有答案