情况:
我希望对给定文本执行深层次分析,这意味着:
问题:
需要采用哪种算法和技术?
是否有可以帮助我这样做的软件?
答案 0 :(得分:3)
当您弄清楚如何执行此操作时,请联系DARPA,CIA,FBI以及所有其他美国情报机构。像这样的项目的合同是目前研究项目,价值数百万美元的研究经费。 ;)
据说你需要分层处理它并分析每个层。对于第2项和第3项,您会发现在n元组上训练SVM(尝试,3)单词将有所帮助。对于1和4,您需要更深入的分析。使用NLTK之类的工具,或许多其他解析器之一,找到句子和相关单词中的主题词。也可以使用WordNet(来自普林斯顿) 找到最常用的感官并将其作为关键词。
5极具挑战性,我认为上面的数据的智能使用可以给你你想要的东西,但你需要使用你所有的语法知识和编程知识,它仍然会非常粗粒度。
答案 1 :(得分:1)
听起来你可能会接受一些实验,在这种情况下,工具包方法可能是最好的?如果是这样,请查看适用于Python的NLTK Natural Language Toolkit。在Apache许可下开源,并且有一些关于它的优秀书籍(包括O'Reilly的一本书,也是根据创意公共许可在线发布的)。