有没有办法使用OpenNLP获得句子的主题?

时间:2011-04-05 18:38:46

标签: java nlp opennlp

有没有办法使用OpenNLP获得句子的主题? 我试图找出用户句子中最重要的部分。一般来说,用户会将句子提交给我们的“引擎”,我们想知道该句话的核心主题是什么。

目前我们正在使用openNlp:

  1. 判断句子
  2. 识别句子的名词短语,动词等
  3. 确定句子的所有“主题”
  4. (未完成!)确定句子的“核心主题”
  5. 如果您有任何好主意,请告诉我。

2 个答案:

答案 0 :(得分:17)

依赖性解析器

如果您有兴趣提取语法关系,例如单词或短语是句子的主语,那么您应该使用dependency parser。虽然OpenNLP确实支持短语结构解析,但我认为它还没有进行依赖解析。

开源软件

用Java编写的支持依赖性解析的包包括:

其中,斯坦福分析师是最准确的。但是,MaltParser的某些配置可能非常快(Cer et al. 2010)。

答案 1 :(得分:2)

对于语法科目,您需要依赖树中的配置信息。如果解析看起来像(TOP(S(NP ----)(VP ----)))那么你可以把NP作为主语;通常,虽然根本不是,但情况往往如此。但是只有一些句子会有这种配置;人们很容易想象那些不在那个位置的受试者的结构 - 例如被动结构。

你最好还是使用MaltParser。

相关问题