除了NLTK之外,Python的最佳信息检索库是什么?

时间:2009-10-28 03:13:54

标签: python information-retrieval text-mining

用于分析互联网上的文件!

2 个答案:

答案 0 :(得分:5)

或者,R有许多可用于文本挖掘的工具,并且integrate with Python using RPy2很容易。

查看Natural Language Processing view on CRAN。特别是,请查看tm包。以下是一些相关链接:

此外,R提供了许多用于解析HTML或XML的工具。有a look at this question for an example using the RCurl and XML packages

答案 1 :(得分:3)

请您提供更多信息,说明为什么NLTK不足或您需要哪些功能才能将某些框架视为“最佳”?

尽管如此,还是有内置的shlex词法解析库。

最近还有一本关于这个主题的书,Natural Language Processing with Python。它看起来至少部分涵盖了NLTK。

您可能还想在awaretek网站上查看此教程和库列表,该列表也指向NLQ.py框架。

Natural Language Processing with Python http://ecx.images-amazon.com/images/I/41NBqj7NyGL._BO2.jpg