我是否需要unicode来识别不同的书写系统

时间:2013-11-04 21:57:13

标签: unicode go

是否最佳,我试图使用其十六进制代码识别特定字符。 (有更好的方法来识别字母,阿拉伯语,中文或日文字符吗?)

http://play.golang.org/p/b81_rgXr3G

   fmt.Printf("%x \n", "가") //eab080
   fmt.Printf("%x \n", "ㅎ") //e3858e

所以韩语确实如此 eab080< e3858e

然后我的问题是 我们是否为每种语言的十六进制边界都有任何表格或图表?

我的意思是,对于英语

 fmt.Printf("%x \n", "A") //41
 fmt.Printf("%x \n", "z") //7a

然后41<图7a

如上所示,字母表的界限在41和7a之间。 我正在尝试另一种不是字母表的书写系统。

我需要unicode来识别不同的书写系统吗? unicode标准库似乎只提供编码和解码英文字母。

提前致谢。

1 个答案:

答案 0 :(得分:3)

不,我们没有针对每种语言的十六进制边界的任何表格或图表。有一些关于通常用于各种语言的字符的数据。

这回答了问题,但您应该考虑这是否是您真正的问题。问题是指编写系统,字母和语言,就像它们是一回事一样;它们是不同的概念。您应该定义您的实际问题:您真正需要哪些信息?在某种语言的文本中,可能会出现任何 Unicode字符。

顺便说一句,英语(至少在某种形式的语言中)还有未婚夫,合作,ôle,anæmia,belovèd等词语。