对数大于0时产生的NaN

时间:2019-03-19 09:23:15

标签: r nan

我想将对数变量设为总资产的变量。我喜欢这样:

`HRSdata2$h1logass <- (ifelse(HRSdata2$h1atotb > 0, log(HRSdata2$h1atotb), 0))`

,我收到错误消息:In log(HRSdata2$h1atotb) : NaNs produced

我的数据集显示,我获取我预测的log(NA)时会得到NA,但是为什么会得到NaN?他们更关心我。

有人还能告诉我运行循环或其他将日志应用于多列的聪明方法的代码吗?目前,这是我的代码(我知道非常差):

HRSdata2$h1logass <- (ifelse(HRSdata2$h1atotb > 0, log(HRSdata2$h1atotb), 0))
HRSdata2$h2logass <- (ifelse(HRSdata2$h2atotb > 0, log(HRSdata2$h2atotb), 0))
HRSdata2$h3logass <- (ifelse(HRSdata2$h3atotb > 0, log(HRSdata2$h3atotb), 0))
HRSdata2$h4logass <- (ifelse(HRSdata2$h4atotb > 0, log(HRSdata2$h4atotb), 0))
HRSdata2$h5logass <- (ifelse(HRSdata2$h5atotb > 0, log(HRSdata2$h5atotb), 0))
HRSdata2$h6logass <- (ifelse(HRSdata2$h6atotb > 0, log(HRSdata2$h6atotb), 0))
HRSdata2$h7logass <- (ifelse(HRSdata2$h7atotb > 0, log(HRSdata2$h7atotb), 0))
HRSdata2$h8logass <- (ifelse(HRSdata2$h8atotb > 0, log(HRSdata2$h8atotb), 0))
HRSdata2$h9logass <- (ifelse(HRSdata2$h9atotb > 0, log(HRSdata2$h9atotb), 0))
HRSdata2$h10logass <- (ifelse(HRSdata2$h10atotb > 0, log(HRSdata2$h10atotb), 0))

我基本上只需要学习如何遍历变量名就可以了。

2 个答案:

答案 0 :(得分:3)

当您执行ifelse(x > 0, log(x), 0)时,R会计算log(x)

> x <- c(2, -1, 3)
> ifelse(x > 0, log(x), 0)
[1] 0.6931472 0.0000000 1.0986123
Warning message:
In log(x) : NaNs produced

但是结果是您没有得到NaN,对于与0相对应的值,您得到了x <= 0

ifelse语句等效于

ifelse(c(TRUE, FALSE, TRUE), c(log(2), log(-1), log(3)), c(0,0,0))

R不会删除对第一个参数的值为FALSE的第二个参数的值的计算。

答案 1 :(得分:0)

我个人对ifelse不满意,倾向于改用两行代码来代替默认值,然后有条件地应用替代方法。

要遍历所有列,您可以使用以下代码(由于没有数据,因此我没有进行测试)

for(i in 1:10){
    HRSdata2[,paste0('h',i,'logass')] <- 0
    w <- which(HRSdata2[,paste0('h',i,'atotb')] > 0)
    HRSdata2[w,paste0('h',i,'logass')] <-  HRSdata2[w,paste0('h',i,'atotb')]
}

此代码将为NA值输出零,如果不需要,则应替换:

w <- which(HRSdata2[,paste0('h',i,'atotb')] > 0)

具有:

w <- which(HRSdata2[,paste0('h',i,'atotb')] > 0 | is.na( HRSdata2[,paste0('h',i,'atotb')] ) )