从大文本文件中删除CRLF

时间:2015-04-18 20:12:59

标签: replace editor

我有一个包含几百万行的1Gig文件。尝试在每行末尾删除CRLF。尝试过EmEdit,GVIM,Notepad ++,UltraEdit。只有EMEdit才能加载文件,但是替换它的速度令人难以置信。也许每秒10行。不要在我的生命中留下足够的岁月等待这一切完成。

我不是程序员所以我严格使用UI对话框。不知道还能做什么。感谢

3 个答案:

答案 0 :(得分:0)

在notepad ++中,您是否尝试过以下操作:

  • 将搜索模式设置为\ r \ n
  • 查找内容 文本框中,输入 \ r \ n
  • 替换为 字段留空
  • 点击 全部替换

或者你已经尝试过了吗?

答案 1 :(得分:0)

Textpad会打开1gb文件,我已经用它做了你说的话......但是这需要很长时间。

我不知道它与你为str-replace提到的其他编辑器的速度比较。

无论如何,如果你有兴趣,这里是从textpad执行此操作的说明: 由于你只限于对话框和窗口,我的答案仅限于安装textpad 7,打开它,按F8键打开搜索/替换对话框。

搜索\ r \ n,替换为空。并检查正则表达式框,否则它将按字面意思。根据您可能正在查找的文件\ r \ n或\ n,或两者。然后点击“替换下一个”几次以确保它有效,最后点击替换所有,如果满意前几个。

希望它有所帮助。

答案 2 :(得分:0)

UltraEdit可以在只有2 GB RAM的计算机上打开任何大小的文件,甚至是超过4 GB的文件。这些大文件应该在UltraEdit中打开而不使用临时文件(修改是永久性的,无法撤消),并且某些选项配置为默认值不同,以便在处理大文件时获得更好的性能,请参阅电源提示Large file text editor。 / p>

但是,对于这个替换,没有必要在UltraEdit中打开大文件。

启动UltraEdit并从菜单搜索中打开替换文件

  • 输入搜索字符串^p并替换字符串。

  • 默认选择列出的文件

  • 使用目录编辑字段右侧的 ... 按钮选择包含大文件的目录。

  • 在编辑字段 In files / types 中输入文件名或带有通配符的字符串,该通配符仅与所选目录中的大文件匹配。

    < / LI>
  • 确保未选择正则表达式,因为^p表示非正则表达式的DOS / Windows行终止(回车+换行)或UltraEdit正则表达式替换仅

  • 点击按钮全部替换

或者选中正则表达式并选择 Unix Perl ,搜索字符串[\r\n]+会找到任何回车符文件中的换行符并替换为空。使用 UltraEdit正则表达式,此类替换的搜索字符串将为[^r^n]+