Question

0186是unicode“代码”。 198和134来自哪里？从这些字节码到unicode字符串，怎么可能相反？

>> c = JSON '["\\u0186"]'
[
    [0] "Ɔ"
]
>> c[0][0]
198
>> c[0][1]
134
>> c[0][2]
nil

另一个令人困惑的事情是解压缩。另一个看似随意的数字。它来自哪里？它甚至是正确的吗？来自1.8.7 String#unpack documentation：

U |整数| UTF-8字符为无符号整数

>> c[0].unpack('U')
[
    [0] 390
]
>

Answer 1

您可以在维基百科关于UTF-8的文章中阅读有关UTF-8编码的更多信息。

UTF-8（UCS Transformation Format - 8-bit [1]）是一种可变宽度编码，可以表示Unicode字符集中的每个字符。它旨在向后兼容ASCII并避免UTF-16和UTF-32中字节顺序和字节顺序标记的复杂化。