如何将Txt文件转换为.Rdata格式

时间:2014-01-03 00:16:13

标签: python r twitter

我正在使用我的python脚本和Tweepy来收集推文并仅提取文本部分。我以txt格式保存了这些推文中的所有文本。

我现在正在尝试在R中加载此文本以使用此模块进行文本分析(http://rpubs.com/gogamza/ko_text_mining)但是,此R模块只接受.Rdata文件,我不知何故需要将我的推文集合提供给R. / p>

R代码说:

library(twitteR)
# n <- 200
# 
# keyword <- '삼성전자'
# 
# keyword <- enc2utf8(keyword)
# 
# rdmTweets <- searchTwitter(keyword, n)

load(url("http://dl.dropbox.com/u/8686172/twitter.RData"))

nDocs <- length(rdmTweets)

所以,在load命令中,我想在那里添加我自己的文本文件 有人可以给我一个提示吗?非常感谢..我非常感激。

1 个答案:

答案 0 :(得分:0)

您可以在R中的txt文件中加载数据并将其另存为RData文件:

sapply(list.files("/folderWithFiles", pattern="*.txt", full.names = TRUE),
       function(x) { myDataInVector = scan(x, what=character()); save(myDataInVector, file=gsub("\\.txt","\\.RData",x))  } )

部分scan(x, what=character())中的阅读假定您在文本文件中将所有数据都作为空格分隔的向量。如果扫描命令采用不同的格式,您可以使用read.table或更改扫描命令的参数。

相关问题