在导入数据之前/导入数据时定义变量类型

时间:2015-06-17 12:43:04

标签: r read.table

我将几个制表符分隔的文件导入到R.在其中一列中,有数字ID长度超过18位。当我为此使用read.table时,它会自动将该列读取为数字,将ID转换为科学格式(例如xxxxE10),然后当我使用as.character时,即使原始ID是相同的,它也会产生相同的字符串两个不同的数字。

我有什么方法可以在R中定义如何在读取数据之前读取数据?或者一般来说,我该如何解决这个问题?

我只是使用read.table命令

df <- read.table(file="data/myfile.txt",sep="\t",header=T, stringsAsFactors=F, encoding="UTF-8")

1 个答案:

答案 0 :(得分:0)

这是解决方案。我的文件包含20列

df <- read.table(file="data/myfile.txt",sep="\t",header=T, stringsAsFactors=F, encoding="UTF-8", colClasses=c(rep("character",20)))