目前我的R循环(见下文)在每次迭代期间都会覆盖自己。我想将每个循环的结果输出到文本文件中。
更详细: R初学者在这里想知道如何在我的脚本中包含一行,以便将每个文件的平均值计算写入文本文件。这样脚本就会创建一个新的空文本文件,然后每次脚本计算文件中第4列的平均值时,该值将输出到文本文件中的一行,该文件包含column1中文件的名称和平均值in第2栏。 谢谢你的帮助!
filename <- system("ls /dir/",intern=TRUE)
for(i in 1:length(filename)){
file <- read.table(filename[i],header=FALSE) ## if you have headers in your files ##
mean <- mean(as.numeric(file$V4))
}
答案 0 :(得分:6)
要在循环运行时执行此操作,请在循环中添加:
write.csv(data.frame(fname=filename[i],mean=mean),file="output.csv",append=TRUE)
然而,这将意味着大量的文件系统开销,并且在R中生成整个数据帧然后将文件作为整体写入会更快。所以代替你的循环写:
means <- sapply(filename, function(x) mean(as.numeric(read.table(x,header=FALSE)$V4)))
然后将文件作为一个整体写入:
write.csv(data.frame(fname=filename,mean=means),file="output.csv")
答案 1 :(得分:4)
以下脚本将首先创建仅包含列名的文件,然后附加每个结果。
filename <- system("ls /dir/",intern=TRUE)
column_names <- data.frame(filename = "filename", mean = "mean")
write.table(column_names, file = "output.csv", row.names = FALSE,
append = FALSE, col.names = FALSE, sep = ", ", quote = TRUE)
for(i in 1:length(filename)){
file <- read.table(filename[i],header=FALSE)
newline <- data.frame(t(c(filename[i], mean(as.numeric(file$V4)))))
write.table(newline, file = "output.csv", row.names = FALSE,
append = TRUE, col.names = FALSE, sep = ", ")
}
虽然在每一步写入文件效率不高,但您可能只考虑在最后进行:
filename <- system("ls /dir/",intern=TRUE)
results <- data.frame(filename = "filename", mean = "mean")
for(i in 1:length(filename)){
file <- read.table(filename[i],header=FALSE)
newline <- data.frame(t(c(filename = filename[i], mean = mean(as.numeric(file$V4)))))
results <- rbind(results, newline)
}
write.table(results, file = "output.csv", row.names = FALSE,
append = FALSE, col.names = TRUE, sep = ", ")