NA替换列表中的NULL / for循环

时间:2017-04-17 16:10:07

标签: r null na data-cleaning

我正在尝试用从API中提取的列表中的NA替换NULL值,但长度不同,因此无法替换。

我已尝试在toxboot包中找到nullToNA函数(找到here),但是当我尝试调用它时它不会在R中找到该函数(我不知道是否有更改)到我无法找到的包或是否因为列表没有从MongoDB中提取而来。我还尝试了所有函数调用检查here。我的代码如下。有什么帮助吗?

library(httr)
library(toxboot)
library(RJSONIO)
library(lubridate)
library(xlsx)
library(reshape2)

resUrl <- "http://api.eia.gov/series/?api_key=2B5239FA427673D22505DBF45664B12E&series_id=NG.N3010CO3.M"

comUrl <- "http://api.eia.gov/series/?api_key=2B5239FA427673D22505DBF45664B12E&series_id=NG.N3020CO3.M"

indUrl <- "http://api.eia.gov/series/?api_key=2B5239FA427673D22505DBF45664B12E&series_id=NG.N3035CO3.M"

apiList <- list(resUrl, comUrl, indUrl)

results <- vector("list", length(apiList))

for(i in length(apiList)){
  raw <- GET(url = as.character(apiList[i]))
  char <- rawToChar(raw$content)
  list <- fromJSON(char)
    for (j in length(list$series[[1]]$data)){
      if (is.null(list$series[[1]]$data[[j]][[2]])== TRUE)
        ##nullToNA(list$series[[1]]$data[[j]][[2]])
        ##list$series[1]$data[[j]][[2]] <- NA
      else
        next
    }
  ##seriesData <- list$series[[1]]$data
  unlistResult <- lapply(list, unlist)
  ##unlistResult <- lapply(seriesData, unlist)
  ##unlist2 <- lapply(unlistResult,unlist)
  ##results[[i]] <- unlistResult
  results[[i]] <- unlistResult
}

我的主题标签有一些我尝试过的东西。但是我还有一些其他方法没有尝试过。

我见过lapply(list,function(x)ifelse(x ==“NULL”,NA,x))但是没有任何运气。

1 个答案:

答案 0 :(得分:2)

试试这个:

library(httr)
resUrl <- "http://api.eia.gov/series/?api_key=2B5239FA427673D22505DBF45664B12E&series_id=NG.N3010CO3.M"
x <- GET(resUrl)
y <- content(x)
str(head(y$series[[1]]$data))
# List of 6
#  $ :List of 2
#   ..$ : chr "201701"
#   ..$ : NULL
#  $ :List of 2
#   ..$ : chr "201612"
#   ..$ : num 6.48
#  $ :List of 2
#   ..$ : chr "201611"
#   ..$ : num 7.42
#  $ :List of 2
#   ..$ : chr "201610"
#   ..$ : num 9.75
#  $ :List of 2
#   ..$ : chr "201609"
#   ..$ : num 12.1
#  $ :List of 2
#   ..$ : chr "201608"
#   ..$ : num 14.3

在第一个网址中,只有$series[[1]]$data中的第一个包含NULL。顺便说一句:明确区分NULL(文字)和"NULL"(一个character字符串,包含4个字母)。

以下是检查NULL的一些方法(使用各种数据类型):

is.null(NULL)
# [1] TRUE
length(NULL)
# [1] 0

到目前为止很简单,让我们尝试列出NULL s:

l <- list(NULL, 1)
is.null(l)
# [1] FALSE
sapply(l, is.null)
# [1]  TRUE FALSE
length(l)
# [1] 2
lengths(l)
# [1] 0 1
sapply(l, length)
# [1] 0 1

(“0”长度表示NULL s。)我将在这里使用lengths

y$series[[1]]$data <- lapply(y$series[[1]]$data, function(z) { z[ lengths(z) == 0 ] <- NA; z; })
str(head(y$series[[1]]$data))
# List of 6
#  $ :List of 2
#   ..$ : chr "201701"
#   ..$ : logi NA
#  $ :List of 2
#   ..$ : chr "201612"
#   ..$ : num 6.48
#  $ :List of 2
#   ..$ : chr "201611"
#   ..$ : num 7.42
#  $ :List of 2
#   ..$ : chr "201610"
#   ..$ : num 9.75
#  $ :List of 2
#   ..$ : chr "201609"
#   ..$ : num 12.1
#  $ :List of 2
#   ..$ : chr "201608"
#   ..$ : num 14.3