R什么是转换多个变量的最佳方法?

时间:2016-07-27 00:27:32

标签: r transformation

我一直在为我的数据转换变量可能比我应该困难一些。什么是转换批量变量的更有效方法?例如:

log_vw = log(msft$vwretd)
log_ew = log(msft$ewretd)
log_sp = log(msft$sprtrn)
log_msft = log(msft$msft)

msft["log_vw"] <- log_vw
msft["log_ew"] <- log_ew
msft["log_sp"] <- log_sp
msft["log_msft"] <- log_msft
head(msft)

我尝试过使用这种方法,但在此过程中我收到了一些错误。

cols <- c("msft$vwretd","msft$ewretd","msft$sprtrn","msft$msft")
df[cols] <- log(cols)

在最后一个例子中,我试图将非数字参数放在数学函数中,这是有道理的。

我理解 for 语句是适当的语句,但我不确定如何构造我的命令。

任何建议都将不胜感激。感谢。

3 个答案:

答案 0 :(得分:3)

如果你是dplyr::mutate_each(msft, funs(log), log_vw = vwretd, log_ew = ewretd, log_sp = sprtrn, log_msft = msft) 的粉丝,你也可以这样做,

library(dplyr)

data.frame(vwretd = runif(10), ewretd = runif(10), sprtrn = runif(10), msft = runif(10)) %>%
  mutate_each(funs(log), log_vw = vwretd, log_ew = ewretd, log_sp = sprtrn, log_msft = msft)

       vwretd    ewretd     sprtrn        msft     log_vw      log_ew     log_sp   log_msft
1  0.54274693 0.1263857 0.88601706 0.458666312 -0.6111121 -2.06841664 -0.1210191 -0.7794323
2  0.44335175 0.5799405 0.05000435 0.004620247 -0.8133918 -0.54482978 -2.9956452 -5.3773070
3  0.10626751 0.6079891 0.77995001 0.474660813 -2.2417957 -0.49759827 -0.2485255 -0.7451548
4  0.56562366 0.7637879 0.03525097 0.199729556 -0.5698263 -0.26946509 -3.3452623 -1.6107910
5  0.39274678 0.7384458 0.62834120 0.888230976 -0.9345902 -0.30320757 -0.4646719 -0.1185235
6  0.04751128 0.5708233 0.53730398 0.425984998 -3.0467881 -0.56067550 -0.6211913 -0.8533511
7  0.57159055 0.9290444 0.31881544 0.679257606 -0.5593324 -0.07359875 -1.1431429 -0.3867548
8  0.10841133 0.9730511 0.26677617 0.097040692 -2.2218227 -0.02731870 -1.3213453 -2.3326249
9  0.17500813 0.3787455 0.14860983 0.480663703 -1.7429229 -0.97089076 -1.9064310 -0.7325874
10 0.89509921 0.4091091 0.79529002 0.681128521 -0.1108207 -0.89377335 -0.2290484 -0.3840043

输出:

{{1}}

答案 1 :(得分:0)

谢谢@ dayne和@thelatemail。这就是我需要的。谢谢。

cols <- c("vwretd","ewretd","sprtrn","msft")
msft[cols] <- lapply(msft[cols], log)

答案 2 :(得分:0)

以下是data.table的选项。转换&#39; data.frame&#39;到&#39; data.table&#39; (setDT(msft)),指定&#39; cols&#39;在.SDcols中,循环遍历Data.table(.SD)的子集,获取log并将输出分配(:=)到新列(paste0("log_",cols) })。

library(data.table)
cols <- c("vwretd","ewretd","sprtrn","msft")
setDT(msft)[, paste0("log_", cols) := lapply(.SD, log), .SDcols = cols]