我正在尝试阅读大量分隔为R的哈希标记的txt文件。
例如:
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
当我尝试以下操作时,只加载第一列,可能是因为第一个哈希标记之后的所有内容都被解释为注释。
(df <- read.table("https://dl.dropboxusercontent.com/u/64191100/hashtagdel.txt",sep="#"))
输出:
# V1
# 1 Dora
# 2 Dora
# 3 Dora
# 4 Dora
# 5 Dora
# 6 Dora
# 7 Dora
# 8 Dora
# 9 Dora
我不想用其他字符更改每个文件中的哈希标记(我没有创建文件)。有人知道解决方法吗?
答案 0 :(得分:6)
来自?read.table
:
comment.char
character:长度为1的字符向量,包含单个字符或空字符串。使用“”完全关闭评论的解释。
所以你需要像read.table(*, sep="#", comment.char="")
答案 1 :(得分:5)
使用read.delim
代替......
df <- read.delim("https://dl.dropboxusercontent.com/u/64191100/hashtagdel.txt" , header = FALSE , sep="#")
df
# V1 V2 V3 V4
#1 Dora 58529 26/04/2012 NA
#2 Dora 58529 26/04/2012 NA
#3 Dora 58529 26/04/2012 NA
#4 Dora 58529 26/04/2012 NA
#5 Dora 58529 26/04/2012 NA
#6 Dora 58529 26/04/2012 NA
#7 Dora 58529 26/04/2012 NA
#8 Dora 58529 26/04/2012 NA
#9 Dora 58529 26/04/2012 NA