如何解析文本中的越南unicode字符

时间:2018-08-27 07:28:16

标签: python unicode

如何使用Python进行解码

[Hài kịch] Vợ ơi là vợ - Vân Sơn Bảo Liêm & Lê Huỳnh

进入此

[Hài kịch] Vợ ơi là vợ - Vân Sơn Bảo Liêm & Lê Huỳnh

谢谢。


我已经从上面的可疑线程中尝试了以下代码:

import re, HTMLParser
title="[Hài kịch] Vợ ơi là vợ - Vân Sơn Bảo Liêm & Lê Huỳnh"
list_of_html = re.findall("&.+?;", title) 
for e in list_of_html:
    h = HTMLParser.HTMLParser()
    unescaped = h.unescape(e)
    title = title.replace(e, unescaped)
print title

但收到错误消息:

Unsupported characters in input 

因为我在标题“kịchVợivợ-SơnBảoHuỳnh”中使用了这些词。我该如何纠正?

0 个答案:

没有答案