是否可以将.NET中的IBM937(带中文zh-tw的EBCDIC)转换为Unicode?
.NET中的编码支持某些EBCDIC编码,但不是全部,尤其是在DBCS中。
我想将EBCDIC字节数组(也许带有0x0e,0x0f)从.NET转换为Unicode字符串。
调查了这个问题后,
我发现有这样一个问题,但是答案是使用Java:
How to convert EBCDIC with Chinese chars to UTF-8 format
另一个答案是使用ICU(Unicode的国际组件)的ICU4C(用于C / C ++)。
如下所示在ICU4C中创建转换器是否正确使用? (我不确定)
conv = ucnv_open("IBM-937", $fromBytes)
// then use ucnv_fromUChars or ucnv_toUChars to convert string.
如果这是正确的,
NuGet软件包icu.net和Icu.Win(ICU4C的.NET包装器)可能会有所帮助。
但是我找不到更多使用此包装器执行ICU4C之类的示例或文档。
任何建议或评论将不胜感激。