用于分析互联网上的文件!
答案 0 :(得分:5)
或者,R有许多可用于文本挖掘的工具,并且integrate with Python using RPy2很容易。
查看Natural Language Processing view on CRAN。特别是,请查看tm
包。以下是一些相关链接:
此外,R提供了许多用于解析HTML或XML的工具。有a look at this question for an example using the RCurl
and XML
packages。
答案 1 :(得分:3)
请您提供更多信息,说明为什么NLTK不足或您需要哪些功能才能将某些框架视为“最佳”?
尽管如此,还是有内置的shlex词法解析库。
最近还有一本关于这个主题的书,Natural Language Processing with Python。它看起来至少部分涵盖了NLTK。
您可能还想在awaretek网站上查看此教程和库列表,该列表也指向NLQ.py框架。
Natural Language Processing with Python http://ecx.images-amazon.com/images/I/41NBqj7NyGL._BO2.jpg