使用Python2.7的xml文件中的特殊字符

时间:2019-02-22 12:38:44

标签: python xml string

我有几个这样的字符串:

  

“ Gesti \ xc3 \ xb3n Tur \ xc3 \ xadstica纲领”

我应该以这种方式存储在xml文件中

<content><![CDATA[Programa Directrices de Gestión Turística]]></content>

我使用以下代码:

from xml.dom import minidom

data_cdata = doc.createCDATASection(text)
cdv = doc.createElement(tag)
cdv.appendChild(data_cdata)
root.appendChild(cdv)
doc.appendChild(root)

但输出为:

<content><![CDATA["Programa Directrices de Gesti\xc3\xb3n Tur\xc3\xadstica]]></content>

我该怎么做?

(对不起,我的英语)

1 个答案:

答案 0 :(得分:0)

Python不会像您所希望的那样表示超出ascii范围的字符。特殊字符\xc3\xb3\xc3\xad与每个字符的十六进制序数有关:óí。 看来您的代码无法很好地转换特殊字符。它没有发布实际的óí,而是发布了它们各自的表示形式:\xc3\xb3\xc3\xad。现在,我对您使用的库一无所知,但是我会在appendChild函数中搜索有关翻译的快速修复。如果找不到它,则可以使用循环来遍历text,以删除特殊字符并将其转换为普通字母 (从“ó”到“ o”)。

我希望我能有所帮助:)。

祝你好运

Jesper