标签: data-structures nearest-neighbor
我有一个数据集,我需要找到K个最近邻居,或距离d内的所有邻居。数据集定义了自定义距离,但它不是欧几里德距离。
之前我使用过metric trees,主要是封面树。但是,在这种情况下,我的数据集将大于可用内存。那么,是否有任何数据结构可用于磁盘存储数据集上的最近邻居?这个操作的良好数据库索引也很有用。
答案 0 :(得分:1)
您可以使用封面树来保存指向磁盘数据集的指针。指针将包含相对记录号以及记录中允许您遍历树的任何其他信息。