使用XRegExp将unicode句子拆分为单词数组

时间:2014-12-15 16:18:05

标签: unicode xregexp

我正在使用以下脚本将Unicode句子拆分为单词数组。

XRegExp.matchChain("læseWEB læser teksten på dit website op.", [XRegExp("[\\p{Alphabetic}\\p{Nd}\\{Pc}\\p{M}]+", "g")])


[ "læseWEB", "læser", "teksten", "på", "dit", "website", "op" ]

现在我期待

['læseWEB ', 'læser ', 'teksten ', 'på ', 'dit ', 'website ', 'op.'].

有人说我需要使用split函数而不是matchChain。

有什么建议吗?

0 个答案:

没有答案