CSV文件,制表符分隔文件或任何文件

时间:2019-07-17 18:24:53

标签: r linux bash csv delimiter

我对文件有疑问。

我问的原因是因为在R中使用了一些功能,例如将数据从外部导入R。

我有一个文件character_student.txt,其数据如下所示。

Name, Age, Gender, Test1
john, 11, M, 90
betty, 25, F, 33

我很困惑。上面的文件是否被视为csv文件(逗号分隔文件)?还是文本文件?在使用R导入时,说该文件到R中,使用说read.csv(file="character_student.txt)是否合适?

然后我要问的另一个问题是,如果我有这样的文件:

Name Age Gender Test1
john 11 M 90
betty 25 F 33

所以每个文件之间只有一个空格,然后说我将其保存为.csv文件,然后我认为文件名将变成类似character_text.csv的形式。然后我只是想知道这个文件现在是空格分隔的文件还是逗号分隔的文件?

我想我的问题是如何知道我的文件是否是逗号分隔的文件?或以空格分隔的文件?或制表符分隔的符号?

它是完全基于文件名吗?例如,如果名称以csv结尾,那么它是逗号分隔的文件,如果以其他东西结尾,那么是“其他”分隔文件?那么文件内部的实际外观是否重要呢?像我们是否必须打开文件以检查是否存在逗号分隔字段以确保文件是逗号分隔的文件?或者,如果我们有一个csv文件,但其中有一个文件,则该字段可能被其他内容分开了?

或者如果它被称为csv,那么里面的每个字段都用逗号分隔(例如,我不必打开它以确保它实际上被逗号分隔)?

1 个答案:

答案 0 :(得分:1)

扩展名未定义文件。它们帮助各种实用程序或工具以指定方式进行处理。

您编写了一个python脚本,并将其另存为hello.c

然后将其像gcc一样传递给gcc hello.c

这没什么不对的。 gcc会接受处理文件,但会报告许多语法错误。

类似地,通过指定.csv,您告诉工具,实用程序或函数您正在传递逗号分隔的文件。

如果您有以下文件:

abc def, ghi jkl,

一个用户想要以以下形式从中提取数据:

abcdef,ghijkl,。对于该用户,最好像空格分隔的文件一样“处理”它。对于其他一些需要的用户, abc defghi jkl,将他视为用逗号分隔的文件很有用。

对于特定情况,您需要研究该特定功能或工具并分析他们需要文件的方式。所以是的,如果某个工具希望文件具有特定的格式,则需要进行检查以将文件相应地传递给该工具。

这与您想要的方式有关。