在XML消息中表示UTF-8的方法

时间:2017-05-02 04:07:56

标签: xml utf-8

希望这不是一个愚蠢的问题

因此,当用XML表示UTF-8编码的非ASCII字符时,我知道我们可以使用小数或十六进制表示

'&安培;#' [0-9] +';' (十进制)

'&安培;#x的' [0-9a-fA-F] +&#39 ;;' (十六进制)

要采用以下表情符号示例,我们可以

十进制HTML实体=&符号+#128578;

十六进制HTML实体=&符号+#x1f642; (十六进制代码点)

然而,此表情符号的UTF-8 HEX值的另一种表示形式是 F0 9F 99 82

那么,如果我们将F0 9F 99 82放入XML中,它是否就像那样或者它是否有前缀,如果是这样的话?

你什么时候使用&符+#x1f642; vs F0 9F 99 82?

1 个答案:

答案 0 :(得分:0)

如果您编写以UTF-8编码的文档,则原始UTF-8编码的字节可以在文件中。请注意编码声明:

<?xml version='1.0' encoding='utf-8'?>
<test></test>

如果您没有使用UTF-8编码,HTML实体可以提供相同的结果:

<?xml version='1.0' encoding='ascii'?>
<test>&#x1f642;&#128578;</test>
相关问题