斯坦福解析器中的黄金POS

时间:2016-12-23 12:38:53

标签: stanford-nlp tokenize pos-tagger

我正在使用没有金edu.stanford.nlp.parser.lexparser.LexicalizedParser的斯坦福解析器(POS-tag),而且在Penn风格中,它正常工作。

我的测试文件是:

(ROOT (S (NP (NNS People)) (VP (MD can) (VP (VB butter) (NP (PRP$ their) (NN bread)) (PP (IN with) (NP (DT a) (NN knife))))) (. .)))

但是,当我想使用-tagSeparator成功构建的火车模型时,使用黄金POS作为我的测试集,但测试阶段完成了解析0句(没有错误并忽略测试句)。

我的测试文件是:

People/NNS can/MD butter/VB their/PRP$ bread/NN with/IN a/DT knife/NN ./.

我阅读this并使用此命令解析我的测试句子:

java -mx1500m -cp "*" edu.stanford.nlp.parser.lexparser.LexicalizedParser -sentences newline -tokenized -tagSeparator / -tokenizerFactory edu.stanford.nlp.process.WhitespaceTokenizer -tokenizerMethod newCoreLabelTokenizerFactory -headFinder edu.stanford.nlp.trees.LeftHeadFinder -train trainpath -testTreebank testpath

是否有单独的命令用于此目的(强制解析器使用这些标记)?

由于

0 个答案:

没有答案