是否有任何算法或解决方案用于术语识别?

时间:2014-03-25 10:26:57

标签: machine-learning nlp text-mining

我想从专业文档集中提取术语单位。是否有任何算法或开箱即用的解决方案? nltk可以这样做吗?

似乎这个帖子解决了我的问题。 Extracting terms with contextual relevance (noun phrases) from text in a .NET project

1 个答案:

答案 0 :(得分:1)

您想要的描述不是很清楚。为了获得更好的帮助,您可能还应该发布一个示例

听起来你正在寻找的是Named Entity Recognition。完全取决于您想要的(和您的数据),现有的系统非常好,但问题肯定没有解决。如果这是您想要的,要查看的重要系统是GATEApache OpenNLP甚至是NLTK