CSV,TSV或TXT文件之间是否存在技术差异?

时间:2016-09-02 18:43:56

标签: csv

我在我的应用程序中不断使用这些文件,但CSV,TSV或TXT文件都不是平面文件? 内容是:

{{1}}

3 个答案:

答案 0 :(得分:11)

它们都是文本文件,遵循相同的“指南”。文件之间的区别是 - 只要创建者遵循一些“规则”,即:

csv个文件将包含 c omma s eparated v ,并且tsv文件将< strong> t ab s 运行 v

对于.txt文件,没有指定格式。

答案 1 :(得分:0)

.csv代表逗号分隔的值,.tsv代表制表符分隔的值。 顾名思义,文件中的不同元素分别用','和'\ t'分隔。 根据数据选择类型。如果我们说的数字大于3位数,则可能需要逗号作为内容的一部分,在这种情况下最好使用csv。 两者都是文本文件类型,并且越来越多地用于分类和数据挖掘目的。 它们没有其他技术区别因素。

答案 2 :(得分:0)

文本文件(文件扩展名可能为txt)将由平台特定的行分隔符(在Windows上为CRLF,在Linux上为LF,等等)来分隔行。在某些编码中人类可以阅读为文本。除了人类可读性的期望之外,这还允许某些平台上的几乎所有文件内容,因此,这更是一种内容分类,而不是特定的文件格式。

其他两种格式通常被认为是文本文件的特殊情况,旨在使自动处理变得容易; tsv,一个“制表符分隔值”文件比csv,一个“逗号分隔值”文件简单。

csv将逗号作为字段分隔符,并且它可能特别使用引号和转义来处理这些字段中出现的逗号和引号。它还可以包括标题行作为文件中的第一行。文件中的最后一行可能以也可能不是以行分隔符结尾。 (Details。)

tsv只是不允许在值中使用制表符,标题行是必需的,最后一行分隔符是必需的。 (Details。)

与数据库相关的“平面文件”是文本文件,而不是机器优化的存储方法(例如固定大小的记录文件或压缩备份文件,或者是使用支持数据验证的更精细的标记语言的文件) );平面文件通常是csvtsv或类似的文件。

这个答案得益于Alex Shpilkin的评论。