TokenRegex规则排除任何其他规则捕获的标记

时间:2018-05-22 09:14:42

标签: java stanford-nlp

我正在使用stanford nlp tokenRegex进行标记化。我正在使用正则表达式文件。以下是我使用的规则。

Rule 1

 {
   ruleType:"tokens",
   pattern:([{tag:/NN/}|{tag:/NNP/}]),
   result:"Single noun"
}

Rule 2

{
   ruleType:  "tokens",
   pattern:([{tag:/NN.*/}|{tag:/CD*/}]),
   result : "Noun with Number"
}

我给出的句子是Take note with the Samsung Notebook 9 Pen,我得到了以下结果

注意 - >单一名词

Samsung Notebook 9 Pen - >名字用数字

即使三星,笔记本,笔......的POS是NN,它也被排除在外。 它不会被rule1捕获,即rule 2排除的rule 1function based view排除。

有没有办法匹配这两个规则?

0 个答案:

没有答案