如何使用GATE的STANFORD PARSER

时间:2013-11-05 22:04:15

标签: stanford-nlp gate

如何使用GATE嵌入式的Stanford解析器(通过Java代码使用GATE)。我目前在我的机器上使用GATE_Developer_7.0;我知道在GATE中有Stanford Parser的插件,但不知道如何使用java代码来使用它。

由于

1 个答案:

答案 0 :(得分:1)

我们一直推荐的GATE Embedded常用方法是使用GATE Developer构建管道,测试它并通过在GUI中处理样本文档来调试它。一旦您对应用程序感到满意,请使用“保存应用程序状态”或“导出GATECloud.net”来生成已保存的状态,然后您可以使用PersistenceManager加载嵌入式代码。这将自动确保加载所有必需的插件,并且通常比在代码中手动构建管道更简单且更不容易出错。

GATE网站上的BatchProcessApp example显示了如何使用PersistenceManager加载已保存的应用程序,基本上是

Gate.init(); // always the first thing you do
CorpusController controller = (CorpusController)PersistenceManager
    .loadObjectFromFile(new File("/path/to/application.xgapp"));
Corpus corpus = Factory.newCorpus("myCorpus");
controller.setCorpus(corpus);

然后为您要处理的每个文档

Document doc = Factory.newDocument(....);
corpus.add(doc);
try {
  controller.execute();
  // code here to do stuff with the annotated document, e.g. extract
  // annotations/features
} finally {
  corpus.clear();
  Factory.deleteResource(doc);
}