有没有办法使用OpenNLP获得句子的主题? 我试图找出用户句子中最重要的部分。一般来说,用户会将句子提交给我们的“引擎”,我们想知道该句话的核心主题是什么。
目前我们正在使用openNlp:
如果您有任何好主意,请告诉我。
答案 0 :(得分:17)
依赖性解析器
如果您有兴趣提取语法关系,例如单词或短语是句子的主语,那么您应该使用dependency parser。虽然OpenNLP确实支持短语结构解析,但我认为它还没有进行依赖解析。
开源软件
用Java编写的支持依赖性解析的包包括:
其中,斯坦福分析师是最准确的。但是,MaltParser的某些配置可能非常快(Cer et al. 2010)。
答案 1 :(得分:2)
对于语法科目,您需要依赖树中的配置信息。如果解析看起来像(TOP(S(NP ----)(VP ----)))那么你可以把NP作为主语;通常,虽然根本不是,但情况往往如此。但是只有一些句子会有这种配置;人们很容易想象那些不在那个位置的受试者的结构 - 例如被动结构。
你最好还是使用MaltParser。