将A +“COMBINING ACUTE ACCENT”转换为Á

时间:2018-05-25 22:36:03

标签: python python-3.x unicode

Mac将á的文件名存储为“LATIN SMALL LETTER A + COMBINING ACUTE ACCENT”而不是“LATIN SMALL LETTER A WITH ACUTE”。如果我正在阅读包含áéíóúÁÉÍÓÚ的文件名,我该如何将它们转换为组合版本?

1 个答案:

答案 0 :(得分:1)

>>> unicodedata.normalize('NFC', 'a\u0301')
'á'
>>> unicodedata.normalize('NFC', 'a\u0301').encode('unicode-escape')
b'\\xe1'