使用脚本从ANSI转换为UTF-8

时间:2017-01-20 11:08:39

标签: bash shell csv unix utf-8

我创建了一个脚本(.sh文件),用于将CSV文件从ANSI编码转换为UTF-8。 我使用的命令是:

iconv -f "windows-1252" -t "UTF-8" $csvname -o $newcsvname

我从另一个Stack Overflow帖子中得到了这个。 但是iconv命令似乎不起作用。 Notepad ++中输入文件内容的快照

以下firstcsv文件的快照 enter image description here

下面第二个csv文件的快照,

enter image description here

编辑:我尝试将有问题的输入CSV文件内容减少到几行(类似于第一个文件),现在它被转换得很好。那么文件内容本身有问题吗?我该如何检查?

1 个答案:

答案 0 :(得分:0)

您可以使用python chardet字符编码检测器来确保现有的字符编码格式。

iconv -f {字符编码} -t utf-8 {FileName}> {输出文件名}

这应该有效。还要检查文件中是否存在任何垃圾字符,这可能会在转换时产生错误。

相关问题