匹配一系列unicode字符

时间:2013-10-09 05:01:48

标签: mysql unicode

我想进行一个匹配任何包含字符0xFB50-0xFDFF(阿拉伯语演示文稿表格-A)和0xFE70-0xFEFF(阿拉伯语演示文稿表格-B)的查询。我已经尝试了各种各样的东西,包括简单的REGEXP,其中包含在[]中的字符,中间有一个短划线(例如,[ݐ-ݭ])但它似乎返回包含阿拉伯语的所有内容,即使它不在“演示文稿中”形成“范围。我想知道是否有类似的东西:   SELECT列FROM db WHERE CHAR(0xFE70)THROUGH CHAR(0xFEFF);

显然没有“通过”运算符,但那是我的伪代码:)

谢谢!

1 个答案:

答案 0 :(得分:0)

从另一篇文章here中找到答案。我认为MySQL的正则表达式引擎不够聪明,不能做我想要的本地,所以我使用了PHP的PCRE功能......

    $arabic_presentation_forms = "[\x{fb50}-\x{feff}]";
    preg_match("/$arabic_presentation_forms/u",$db_output);

工作得很好。