不完整的斯坦福OpenIE输出

时间:2016-06-21 20:17:45

标签: stanford-nlp

我正在尝试使用CoreNLP测试/运行Stanford OpenIE程序。

http://nlp.stanford.edu/software/openie.html

http://stanfordnlp.github.io/CoreNLP/openie.html

这是我的命令:java -mx1g -cp stanford-corenlp-3.6.0.jar;stanford-corenlp-3.6.0-models.jar;CoreNLP-to-HTML.xsl;slf4j-api.jar;slf4j-simple.jar edu.stanford.nlp.naturalli.OpenIE

我的输入文件包含以下文字:

Born in Honolulu, Hawaii, Obama is a US Citizen.
Born in a small town, she took the midnight train going anywhere.

我得到以下输出:

1.0 Obama   is  US Citizen
1.0 she Born in small town
1.0 she Born in town

根据Angeli等人撰写的题为“利用开放域信息提取的语言结构”的论文中提到的例子,我期待更多三元组,如(Obama; born in; Honolulu, Hawaii)(She; took; midnight train)。为什么输出不完整?

此外,在OpenIE实现中使用了什么类型的依赖解析?

谢谢!

1 个答案:

答案 0 :(得分:0)

这些是依赖关系解析中的错误。在论文发表之后,我们转向了Universal Dependencies,它大大改变了底层解析器。您可以在http://corenlp.run

的句子旁边看到OpenIE

在第一种情况下,从“公民”到“出生”的dep弧是不正确的。在第二种情况下,从“接”到“走”的ccomp边缘引起问题。在旧的表示中,这是从“接受”到“火车”的vmod。您可以尝试以下方法:

Born in Honolulu, Obama is a US Citizen.
Born in a small town, she took the midnight train.