使用Ruby拆分Unicode字符串

时间:2009-10-25 02:29:04

标签: ruby unicode

如何在Ruby中拆分字符串按Unicode范围。我想用逗号分隔\ u1000和\ u1000。例如,我想拆分这个字符串......

  

我爱ျမန္မာ

到此......

  

我爱,ျမန္မာ

您可能在我的示例中看不到Unicode字符。这是Unicode范围\ u1000及以上。

感谢。

1 个答案:

答案 0 :(得分:2)

取决于您使用的是哪个版本;这是1.9的解决方案。我想1.8可能会变丑。

这取决于优雅,但似乎有效。

"I love ျမန္မာ".gsub(/([\u0000-\u0999])([\u1000-\u9999])/, '\1,\2')

如果这种方法合适,你必须提供另一种情况(从高到低的过渡)