有没有'Unicode整理'这样的东西?

时间:2012-07-07 10:04:04

标签: sql-server unicode internationalization

如果没有,那么实际上什么是Sql Server collation?也许我对整理(作为一个概念)的理解是错误的。

我不希望将我的整理指定为希腊语或冰岛语甚至是西欧语言。我希望能够使用Unicode支持的任何语言。

(我正在使用MSSQL 2005)

更新:好的,我正在改写这样一个问题:是否有一种通用的,独立于文化的校对,可用于任何文化的文本?我知道它不会包含文化特定的规则,如匈牙利语中的“ty”或德语中的“ß= ss”,但会提供一致的,大部分可接受的结果。

是否存在特定于文化的整理?

3 个答案:

答案 0 :(得分:12)

嗯,总有像Latin1_General_BIN2这样的二进制排序规则。它以数字顺序存储代码点,这可能非常随意。虽然这个名称不是文化特定的。

听起来没有任何智能方法可以将来自多种语言/文化的数据排序在一起,所以您只需按二进制值排序,而不是半生不熟的解决方案。

答案 1 :(得分:5)

这是一篇很好的文章,知道什么是整理,简短和甜蜜:SQL Server and Collation

整理是允许您对数据进行比较和排序的东西。据我所知,没有像Unicode排序规则那样的东西。

答案 2 :(得分:0)

有一个默认的Unicode归类, “默认的Unicode排序规则元素表(DUCET)”, Unicode排序算法技术标准文档中描述的内容 http://www.unicode.org/reports/tr10/

但是有人称它为默认Unicode归类,而不是 Unicode归类,因为当然 一个-例如匈牙利语的unicode.org图表 http://www.unicode.org/cldr/charts/28/collation/hu.html 描述了匈牙利语Unicode校对规则 字符与DUCET不同。

由于提出了这个问题, SQL Server排序规则已变得更加支持Unicode https://docs.microsoft.com/en-us/sql/relational-databases/collations/collation-and-unicode-support?view=sql-server-2017。同时,一些开源DBMS通过合并ICU(Unicode的国际组件)库,已经具有支持DUCET和其他Unicode归类的功能。