sql-server - 有没有'Unicode整理'这样的东西？

时间：2012-07-07 10:04:04

标签： sql-server unicode internationalization

如果没有，那么实际上什么是Sql Server collation？也许我对整理（作为一个概念）的理解是错误的。

我不希望将我的整理指定为希腊语或冰岛语甚至是西欧语言。我希望能够使用Unicode支持的任何语言。

（我正在使用MSSQL 2005）

更新：好的，我正在改写这样一个问题：是否有一种通用的，独立于文化的校对，可用于任何文化的文本？我知道它不会包含文化特定的规则，如匈牙利语中的“ty”或德语中的“ß= ss”，但会提供一致的，大部分可接受的结果。

是否存在不特定于文化的整理？

答案 0 :(得分：12)

嗯，总有像Latin1_General_BIN2这样的二进制排序规则。它以数字顺序存储代码点，这可能非常随意。虽然这个名称不是文化特定的。

听起来没有任何智能方法可以将来自多种语言/文化的数据排序在一起，所以您只需按二进制值排序，而不是半生不熟的解决方案。

答案 1 :(得分：5)

这是一篇很好的文章，知道什么是整理，简短和甜蜜：SQL Server and Collation。

整理是允许您对数据进行比较和排序的东西。据我所知，没有像Unicode排序规则那样的东西。

答案 2 :(得分：0)

有一个默认的Unicode归类， “默认的Unicode排序规则元素表（DUCET）”， Unicode排序算法技术标准文档中描述的内容 http://www.unicode.org/reports/tr10/。

但是有人称它为默认Unicode归类，而不是 Unicode归类，因为当然一个-例如匈牙利语的unicode.org图表 http://www.unicode.org/cldr/charts/28/collation/hu.html 描述了匈牙利语Unicode校对规则字符与DUCET不同。

由于提出了这个问题， SQL Server排序规则已变得更加支持Unicode https://docs.microsoft.com/en-us/sql/relational-databases/collations/collation-and-unicode-support?view=sql-server-2017。同时，一些开源DBMS通过合并ICU（Unicode的国际组件）库，已经具有支持DUCET和其他Unicode归类的功能。