采样大数据文件

时间:2010-04-01 18:46:02

标签: editor text-editor flat-file

我目前在数据仓库程序员的位置工作,因此必须通过ETL过程放置大量的平面文件。当然在加载文件之前我必须知道它的内容,问题是大多数文件都是> 1 GB大,我不能用我亲爱的老朋友“记事本”打开它们。开玩笑。我通常使用VIM或Notepad ++,但打开文件仍需要一段时间。我可以使用VIM或其他编辑器对文件执行“部分”读取吗?

P.S。我知道我可以在文件的“数据样本”上写一个10行内容脚本,但说服团队成员使用编辑器的功能而不是我写的脚本会更简单。

感谢您提供的任何见解。

6 个答案:

答案 0 :(得分:3)

如果你想坚持使用vim,你可以查看LargeFile脚本。

或者,我总是发现UltraEdit非常快速地打开大文件。

答案 1 :(得分:3)

你说你有VIM,这让我想知道你是否也有unix环境?

如果您愿意,可以通过unix实用程序top管道输入并在屏幕上显示原始输入。像这样:

编辑 :(感谢Honk)

terminal$> head -N 15 file.csv

(其中15表示你只想看15行)。

答案 2 :(得分:2)

很确定有很多类似的问题,但是嘿,Textpad是一个不错的选择。

答案 3 :(得分:2)

使用head命令。

答案 4 :(得分:1)

在solaris上使用'less'...在windows上使用相同的cygwin。在大型机上没有出现这个问题,ISPF编辑器处理得很好。

答案 5 :(得分:0)

UltraEdit声称处理超过4GB的文件......