有什么方法可以将IBM937转换为.NET中的Unicode

时间:2020-04-21 13:33:58

标签: c# .net icu ebcdic

是否可以将.NET中的IBM937(带中文zh-tw的EBCDIC)转换为Unicode?
.NET中的编码支持某些EBCDIC编码,但不是全部,尤其是在DBCS中。

我想将EBCDIC字节数组(也许带有0x0e,0x0f)从.NET转换为Unicode字符串。

调查了这个问题后,
我发现有这样一个问题,但是答案是使用Java:
How to convert EBCDIC with Chinese chars to UTF-8 format

另一个答案是使用ICU(Unicode的国际组件)的ICU4C(用于C / C ++)。
如下所示在ICU4C中创建转换器是否正确使用? (我不确定)

conv = ucnv_open("IBM-937", $fromBytes)
// then use ucnv_fromUChars or ucnv_toUChars to convert string.

如果这是正确的,
NuGet软件包icu.net和Icu.Win(ICU4C的.NET包装器)可能会有所帮助。
但是我找不到更多使用此包装器执行ICU4C之类的示例或文档。

任何建议或评论将不胜感激。

0 个答案:

没有答案
相关问题