有人可以解释ja_JP.UTF8吗?

时间:2010-01-12 11:29:21

标签: character-encoding

我知道utf8,但* .utf8之间的区别是什么?

来自the answer to my post

5 个答案:

答案 0 :(得分:4)

Locale = ja_JP 
Encoding = UTF-8

答案 1 :(得分:2)

在Unicode之前,处理非英文字符是使用代码页(如this)和特殊字符集(如:Shift_JIS)之类的技巧完成的。 UTF-8包含更大范围的字符,具有完全不同的映射系统(即每个字符通过数字处理的方式)。

ja_JP.UTF8设置为区域设置时,“UTF8”部分表示所需特殊字符的编码。例如,当您在日语区域设置中输出货币金额时,您将需要¥字符。编码信息定义用于显示¥的字符集。

我假设可能存在ja_JP.Shift_JIS语言环境。与UTF8之一的一个不同之处是,¥符号以这种特定编码的方式显示。

为什么选择ja_JP?

两个代码ja_JP表示语言(我认为基于this ISO norm)和国家(基于this one)。如果在多个国家/地区使用某种语言,这一点很重要。例如,在德语区,瑞士格式的编号与德国人不同:1'000'0001.000.000。国家/地区代码用于在同一种语言中定义这些区别。

答案 2 :(得分:1)

在哪种情况下? ja_JP告诉我们字符串是日语。这与字符编码没有任何关系,但可能会使用 - 取决于上下文 - 用于程序中显示文本的排序,键盘输入和语言。

答案 3 :(得分:0)

猜测一下,我会说每个带有该命名约定的utf8文件都包含翻译网站的语言定义。

答案 4 :(得分:0)

这是一个locale名称。基本格式为语​​言_ COUNTRY。 ja =日语,JP =日本。

除日期格式,货币符号等外,每个区域设置都与字符编码相关联。这是每种语言都有自己编码的历史遗留。现在,UTF-8为每个语言环境提供了一个通用编码。

.UTF8是区域设置名称的一部分,是为了区别于具有不同编码的旧区域设置。例如,我的系统上有一个ja_JP.EUC-JP区域设置。对于德国,可以选择de_DE(使用ISO-8859-1编码的过时的欧元前区域设置),de_DE@euro(ISO-8859-15编码,以提供€符号),以及{ {1}}。