大数据集和自相关计算

时间:2018-02-22 15:42:12

标签: r memory spatial large-data gis

我在城镇一级有35 000个城镇的地理数据。 我想估计我的协变量X对因变量Y的影响,同时考虑自相关。 我首先计算了权重矩阵,然后我使用了垃圾邮件包中的命令 spautolm ,但它返回了一条错误消息,因为我的数据集太大了。 你有什么想法我怎么解决它?是否还有其他等效命令可以使用?

library(haven)
library(tibble)
library(sp)
library(data.table)

myvars <- c("longitude","latitude","Y","X")
newdata2 <- na.omit(X2000[myvars]) #drop observations with no values for one observation
df <- data.frame(newdata2) 
newdata3<- unique(df) #drop duplicates in terms of longitude and latitude
coordinates(newdata3) <- c("longitude2","latitude2") #set the coordinates
coords<-coordinates(newdata3) 
Sy4_nb <- knn2nb(knearneigh(coords, k = 4)) # Display the k closest neighbours
Sy4_lw_idwB <- nb2listw(Sy8_nb, glist = idw, style = "B") #generate a list weighted by the distance

当我尝试运行这样的公式时:

spautolm(formula = Y~X, data = newdata3, listw = Sy4_lw_idwB)

它返回我:错误:无法分配大小为8.3 Gb的矢量

0 个答案:

没有答案