unix命令和脚本KSH shell

时间:2017-04-04 12:14:49

标签: unix command ksh tr

我有一个名为test.dat的文件,它有一个unicode字符,如下所示:

Mu?oz Rivera 
35 Mu�oz Rivera Ave., Apt 1001

我使用以下命令删除unicode字符:

tr -Ac '[\007-\015][\040-\176]' '[\000*]' < test.dat > sample.dat ;  mv  sample.dat test.dat

该命令运行良好,但问题是我的文件格式是UFT-8,但执行命令后,格式转换为ANSI-1252。

我应该在上面显示的命令中做什么修改才能保留字符编码?

我可以像以前一样在命令行中看到输出文件中的数据。 但是,如果我使用notepad ++或ultra edit打开处理过的文件(o / p文件),我可以看到不同的格式(在ansi而不是uft-8中)。

0 个答案:

没有答案
相关问题