获取Unicode代码点对应的字符

时间:2018-05-25 01:24:47

标签: python unicode python-unicode

对于计算机科学课程,我们必须制作一个python程序,将一个字符转换为它的Unicode Codepoint(bin / hex数字,它是对该字符的引用)。是否存在可以执行此操作的函数,例如ord()函数如何转换为ASCII并且是否存在相反的函数,将Unicode代码点转换为字符?

由于

2 个答案:

答案 0 :(得分:0)

内置函数ord也适用于Python2和PYthon3中的unicode字符。

Python 3

>>> c='\U0010ffff'
>>> ord(c)
1114111

Python 2

>>> c=u'\U0010ffff'
>>> ord(c)
1114111

Python 2和Python 3之间的区别

Python 2和Python 3之间的区别在于你反过来。

在Python 3中,函数chr可以接受任何代码,ascii或unicode,并输出字符。

在Python 2中,函数chr用于扩展ascii(代码0到255),函数unichr用于unicode。

这是因为在Python 2中,unicode和ascii字符串是两种不同的类型。

十六进制

如果您需要以十六进制获取字符代码,可以使用hex

>>> hex(1114111)
'0x10ffff'

二进制

如果您需要获取二进制字符,可以使用bin

>>> bin(1114111)
'0b100001111111111111111'

答案 1 :(得分:0)

在Python3中,如果您知道字符的unicode代码点,例如具有Unicode代码点\u6211的{​​{3}},则可以通过以下方式获取字符:

chr(0x6211)