Unicode中的国家(非阿拉伯语)数字?

时间:2010-09-17 08:21:24

标签: unicode

我知道unicode包含来自大多数世界字母表的所有字符..但是数字呢?它们是否是unicode的一部分?我无法找到直接答案。 感谢

6 个答案:

答案 0 :(得分:10)

如前所述,印度 - 阿拉伯数字(0,1,..,9)包含在Unicode中,继承自ASCII。如果你在谈论用其他语言表示数字,答案仍然是肯定的,它们也是Unicode的一部分。

//numbers (0-9) in Malayalam (language spoken in Kerala, India)
൦ ൧ ൨ ൩ ൪ ൫ ൬ ൭ ൮ ൯  
//numbers (0-9) in Hindi (India's national language)
० १ २ ३ ४ ५ ६ ७ ८ ९ 

您可以在正则表达式中使用\p{N}\p{Number}来匹配任何类型的numeric character in any script

document(第3页)描述了马拉雅拉姆语数字的Unicode代码点。

答案 1 :(得分:3)

简而言之:是的,当然。 UNICODE中有三个类别,包含各种数字和数字表示:

  • 数字,十进制数字characters) - 例如阿拉伯语,泰语,梵文数字;
  • 数字,信件characters) - 例如罗马数字;
  • 数字,其他characters) - 例如级分。

答案 2 :(得分:2)

Unicode points below 128与ASCII完全相同,所以,是的,它们在U + 0030到U + 0039(含)。

答案 3 :(得分:1)

他们是 - 代码点00300039,您可以看到,例如在decodeunicode.org上

顺便说一句,代码点0000-007E与ASCII相同(0-127,128 +不再是ASCII),所以您可以在Unicode中找到任何可以在Unicode中找到的内容。

答案 4 :(得分:1)

是的我这么认为: Information Taken From Here

U+0030  0   30  DIGIT ZERO
U+0031  1   31  DIGIT ONE
U+0032  2   32  DIGIT TWO
U+0033  3   33  DIGIT THREE
U+0034  4   34  DIGIT FOUR
U+0035  5   35  DIGIT FIVE
U+0036  6   36  DIGIT SIX
U+0037  7   37  DIGIT SEVEN
U+0038  8   38  DIGIT EIGHT
U+0039  9   39  DIGIT NINE

答案 5 :(得分:1)

你可以自己回答这个问题:如果它们不是Unicode的一部分,这会大大降低Unicode的实用性,你不觉得吗?

基本上,任何需要使用数字的文本都无法使用Unicode代码点表示。 (这假设您不会在一个文本中不同的字符编码之间来回切换:我不知道支持这种情况的单一软件/编程语言,并且有充分的理由。)

如果出现这样的问题,你非常需要阅读Joel Spolsky的The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)。认真。去读吧。

相关问题