从字符串中提取所有名词

时间:2011-05-04 13:55:42

标签: python nlp

  

可能重复:
  Extracting nouns from Noun Phase in NLP

有没有人举例说明如何使用Python NLTK从字符串中提取所有名词?

例如,我有这个字符串:“我喜欢西红柿和生菜”。我想构建一个返回“Tomatoes”和“Lettuce”的方法。

如果不是在Python中,是否有人知道任何其他解决方案?

2 个答案:

答案 0 :(得分:1)

获取NLTK包,然后使用其内置解析器,然后this method;或者,更快,part-of-speech tag字符串并获取带有标记NN的所有单词;那些是名词。阅读其他词性标签,了解如何正确提取Ilike

这两种方法都没有完美,但它是你能做的最好的方法。在干净的输入上,良好的词性标注器的准确度将高于95%。我不认为你可以通过基于WordNet的方法达到这样的准确性,而不需要额外工作很多

答案 1 :(得分:0)

Dave Taylor使用Bash编写了一个adlib生成器,它询问了Princetons wordnet以完成这项任务。你可以在python中做一些非常相似的事情,当然还有wordnet帮助。

这是链接

Linux Journal - Dave Taylor adlib generator.