NLP从句子中提取字典单词

时间:2016-09-19 08:51:55

标签: nlp stanford-nlp apache-spark-mllib data-science

我使用Standford NLP来识别给定句子的POS。

我需要从句子中提取适当的单词(在词典中定义的单词)。

例如:如果句子是“我在飞行中去了纽约6AWDR

当我使用Standford NLP时,PartOfSpeechAnnotation.class将“ flight ”和“ 6AWDR ”这两个词标记为“NNP”。

如何在一个句子中单独提取适当的英语单词?

1 个答案:

答案 0 :(得分:0)

我使用Apache Utils来识别字符串是否为Alpha。

假设大多数字母数字单词在字典中不是有效单词(除非它们是缩写)