Question

初步信息 操作系统：Windows XP Professional版本2002 Service Pack 3; R版本：R 2.12.2（2011-02-25）

我试图使用read.delim()函数将一个30,000行80列，制表符分隔的文本文件读入R中。此文件的列标题具有以下命名约定：“_”。我用来尝试读取数据的代码是：

cc <- c("integer", "character", "integer", rep("character", 3), 
        rep("integer", 73))

example_data <- read.delim(file = 'C:/example.txt', row.names = FALSE,
                           col.names = TRUE, as.is = TRUE, colClasses = cc)

提交此命令后，收到以下错误消息：

Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
more columns than column names
In addition: Warning message:
In read.table(file = file, header = header, sep = sep, quote = quote,  :
  header and 'col.names' are of different lengths

可能很重要的信息 - 从第8列到第80列，每列中的零数如下：

column 08: 29,000 zeros
column 13: 15,000 zeros
column 19: 500 zeros
column 43: 15,000 zeros
columns 65-80: 29,000 zeros for each column

任何人都可以帮助确定我收到上述错误消息的原因吗？任何帮助将不胜感激。

Answer 1

问题的原因是您使用col.names=TRUE参数。这应该被手动用于指定结果数据框的列名，因此必须是一个与输入中的列相同长度的向量，每列一个名称。

如果您希望read.delim从文件中获取列名，请考虑使用header=TRUE;您可能还希望重新考虑row.names=TRUE，因为这是作为行名称的规范，而不是从文件中读取它们的指令。

read.delim的帮助页面提供了更多信息。

Answer 2

我最近也遇到了同样的错误，它在将文件转换为逗号或分号分隔后消失，并使用read.csv / read.csv2读取它。我知道这不是一个完整的答案，但也许你可能会检查出来。

Answer 3

如果您想要读取字符矩阵，请先将文件转换为.csv格式并使用read.csv。不要使用文件名以外的任何其他声明。例如。;

read.csv("filepath")

read.delim（） - 错误“比列名更多的列”和“标题和''col.names”具有不同的长度“

3 个答案: