Question

从data.frame开始，例如：

df = read.table(text = "ref1  code1,code2
           ref2 code3,code4,code5
           ref3 code6", stringsAsFactors=F)
names(df) = c('id', 'codes')
print(df)
    id             codes
1 ref1       code1,code2
2 ref2 code3,code4,code5
3 ref3             code6

希望得到这样的结果：

lst = list()
for(i in 1:3) lst[[df[i,1]]] = strsplit(df[i,2], ',')[[1]]
print(lst)
$ref1
[1] "code1" "code2"

$ref2
[1] "code3" "code4" "code5"

$ref3
[1] "code6"

如果没有（缓慢）迭代，怎么可能达到这一点？ as.list(df)仅适用于列：

$id
[1] "ref1" "ref2" "ref3"

$codes
[1] "code1,code2"       "code3,code4,code5" "code6"

提前致谢。

Answer 1

这样的事情，也许是：

lapply(split(df$codes,df$id),function(x) strsplit(x,split = ",")[[1]])
$ref1
[1] "code1" "code2"

$ref2
[1] "code3" "code4" "code5"

$ref3
[1] "code6"

下面提到的Ananda的解决方案是恕我直言，远远优于：

setNames(strsplit(df$codes, ","), df$id)

Answer 2

这是另一种方法。

> lst <- unlist(apply(df[,2, drop=FALSE], 1, strsplit, ","), recursive=FALSE)
> names(lst) <- df[,1]
$ref1
[1] "code1" "code2"

$ref2
[1] "code3" "code4" "code5"

$ref3
[1] "code6"

同样使用setNames命名列表，如@Henrik的回答

> setNames(unlist(apply(df[,2, drop=FALSE], 1, strsplit, ","), recursive=FALSE), df$id)

Answer 3

你也可以试试这个

library(splitstackshape)
ll <- concat.split.list(data = df,
                        split.col = "codes",                
                        drop = TRUE)[[2]]
names(ll) <- df$id
ll

# $ref1
# [1] "code1" "code2"
# 
# $ref2
# [1] "code3" "code4" "code5"
# 
# $ref3
# [1] "code6

更新@Ananda Mahto的评论。谢谢！

setNames(concat.split.list(df, "codes")[["codes_list"]], df$id)

强制data.frame逐行列出

3 个答案: