找到非Ascii字符

时间:2011-02-28 22:44:44

标签: non-ascii-characters

  

可能重复:
  How Do I grep For non-ASCII Characters in UNIX

我正在努力寻找一个如何在非常大的xml数据文件中找到非ascii字符的答案。我不想转换非ascii字符,我只是想确定字符所在的数据文件中的位置,以便我可以通知源删除该值。非ascii数据(似乎是单个字符)导致我的处理程序失败。不幸的是,错误数据无法帮助我确定有问题的字符在文件中的位置。此XML数据文件包含数据记录,很可能位于描述字段或名称字段中。

我尝试过使用文字工具,但它是一个如此庞大的文件(> 32MB)的文字,它是压倒性的。有没有办法在像PSPad或TextPad这样的工具中运行REGEX来查找7-BIT ASCII字符集之外的任何字符?

0 个答案:

没有答案