如何使用stanford-parser从文本文件中提取每个句子?

时间:2015-04-29 02:26:51

标签: java nlp stanford-nlp sentiment-analysis

我需要从给定的文本文件中提取每个句子并将该句子存储在String中。我正在使用stanford-parser的lexparser-gui,该工具突出显示给定文件的每个句子。有没有办法,我可以使用stanford-parser.jar在java程序中进行句子提取?如果是的话,有人可以举例说明如何做。

谢谢, Sambhav

1 个答案:

答案 0 :(得分:1)

如果您只想从文本文件中提取句子,则无需使用解析器。您可以采用常规句子分割器,如下所示:

    Properties props = new Properties();

    props.setProperty("annotators","tokenize, ssplit");

    StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
    Annotation annotation = new Annotation("This is sentence one. This is sentence two.");
    pipeline.annotate(annotation);
    List<CoreMap> sentences = annotation.get(CoreAnnotations.SentencesAnnotation.class);
    for (CoreMap sentence : sentences) {
        System.out.println(sentence);
    }