algorithm - 为n个数据点中的每一个排序n-1个最近邻居

由于您的输出为O（n ^ 2），因此您将无法获得更好的结果。

我认为这归结为您可以相对于到点q的距离对所有其他点进行排名的速度。如果您有索引结构（例如KD-Tree或R-Tree），则可以使用distance browsing对所有其他点进行排序。 q。

距离浏览的基本思想是拥有一个优先级队列pq，其条目按到q的最小距离排序。 pq可以包含索引结构的点和条目。首先将索引结构的根条目放入pq。然后，您开始从pq弹出元素。当您遇到一个条目（节点）时，可以对其进行解析，然后将子级放回pq中。当遇到一个点时，便找到了q的下一个最近邻居。

总体而言，索引结构具有O（n）个条目。从pq弹出元素是O（log | pq |）。这使运行时为O（n * log | pq |）。问题是平均每个pq中有多少个元素。

我没有证据，但是快速草图让我假设对于L_1和2D空间，队列中元素的平均数量应约为O（sqrt（n））。请注意，队列的大小在很大程度上取决于距离度量和点的大小。

将所有这些放在一起即可构建索引结构（O（n log n）），然后对每个点q排名所有其他点（O（n * log（sqrt（n））））

总体而言，这为您提供了O(n * log(n) + n^2 * log(sqrt(n)))的运行时间。

但是，回显@MBo：这是一个很大的麻烦，与O（n ^ 2 * log（n））相比没有什么改善