我将几个制表符分隔的文件导入到R.在其中一列中,有数字ID长度超过18位。当我为此使用read.table时,它会自动将该列读取为数字,将ID转换为科学格式(例如xxxxE10),然后当我使用as.character时,即使原始ID是相同的,它也会产生相同的字符串两个不同的数字。
我有什么方法可以在R中定义如何在读取数据之前读取数据?或者一般来说,我该如何解决这个问题?
我只是使用read.table命令
df <- read.table(file="data/myfile.txt",sep="\t",header=T, stringsAsFactors=F, encoding="UTF-8")
答案 0 :(得分:0)
这是解决方案。我的文件包含20列
df <- read.table(file="data/myfile.txt",sep="\t",header=T, stringsAsFactors=F, encoding="UTF-8", colClasses=c(rep("character",20)))