在数据框中查找与给定点最近的 3 个点

时间:2021-07-12 12:18:45

标签: r raster sf sp

我有一个包含纬度和经度的数据框,如下所示:

x    y     set 
61  -112   
63  -113 
61  -113
62  -111   point 
61  -111
64  -120

我想找到与 point 列中标记为 set 的点最近的三个点。然后,对于这三个最近的点,我想将 set 列修改为 closest。像这样:

x    y     set 
61  -112   closest
65  -113 
62  -113   closest 
62  -111   point 
62  -111   closest
64  -120

我该怎么做?

2 个答案:

答案 0 :(得分:2)

dists <- geosphere::distHaversine(dat[dat$set=="point",c("y","x")], dat[,c("y","x")])
dists
# [1] 123339.4 151513.9 153862.4      0.0 111319.5 505814.4
dat$set[dat$set != "point" & rank(dists) < 5] <- "closest"
dat
#    x    y     set
# 1 61 -112 closest
# 2 63 -113 closest
# 3 61 -113        
# 4 62 -111   point
# 5 61 -111 closest
# 6 64 -120        

我们使用 < 5 的原因是自身距离(pointpoint)将是最近的(0),因此我们需要排名 2-4 .这假设有一个 "point";如果还有更多,您可能需要 outer(生成 matrix 的距离)并在填充 $set 之前查看每一行。

我是从 标签推断纬度和经度,所以选择了Haversine距离计算,因为它很快,而且粗坐标的出现并不表明对亚毫米精度的要求(即Vincenty Ellipsoid公式)。如果需要,还有其他距离计算。

答案 1 :(得分:1)

这里首先是另一种使用 geosphere 的方法(使用 distm 创建距离矩阵),然后我将展示如何使用 terra::nearby 方法(它适用于 long/lat 和平面坐标)。

m <- matrix(c(61, -112, 63, -113, 61, -113, 62, -111, 61, -111, 64, -120), ncol=2, byrow=TRUE)
# note that the order should be long/lat !!!
m <- m[, 2:1]

d <- geosphere::distm(m)
diag(d) <- NA
i <- order(d[4,])[1:3]
i
#[1] 5 1 2

m[i,]
#     [,1] [,2]
#[1,] -111   61
#[2,] -112   61
#[3,] -113   63

现在使用 terra。下面获取所有点的最近的 3 个邻居。

library(terra)
v <- vect(m, crs="+proj=lonlat")

nearby(v, k=3)
#  id k1 k2 k3
#1  1  3  5  4
#2  2  4  3  1
#3  3  1  5  4
#4  4  5  1  2
#5  5  1  3  4
#6  6  2  3  4

使用 terra 1.3.15 版(目前是开发版)您也可以这样做

nearby(v[4,], v, k=4)
#     id k1 k2 k3 k4
#[1,]  1  4  5  1  2

k=4 个邻居作为第一个是点本身。

要获取开发版本,请执行 install.packages('terra', repos='https://rspatial.r-universe.dev')