NLP:语言分析技术和算法

时间:2011-01-24 13:36:57

标签: nlp

情况:

我希望对给定文本执行深层次分析,这意味着:

  1. 能够根据上下文使用情况提取关键字并指定重要性级别。
  2. 能够对表达的情绪得出结论。
  3. 提示教育水平的能力(虽然这个词有点做,但更自动化了)
  4. 能够混合和匹配短语并找出某些沟通模式
  5. 能够从中汲取实质意义,因此可以对其进行量化,并可以通过机器进行处理。
  6. 问题:

    需要采用哪种算法和技术?

    是否有可以帮助我这样做的软件?

2 个答案:

答案 0 :(得分:3)

当您弄清楚如何执行此操作时,请联系DARPA,CIA,FBI以及所有其他美国情报机构。像这样的项目的合同是目前研究项目,价值数百万美元的研究经费。 ;)

据说你需要分层处理它并分析每个层。对于第2项和第3项,您会发现在n元组上训练SVM(尝试,3)单词将有所帮助。对于1和4,您需要更深入的分析。使用NLTK之类的工具,或许多其他解析器之一,找到句子和相关单词中的主题词。也可以使用WordNet(来自普林斯顿)  找到最常用的感官并将其作为关键词。

5极具挑战性,我认为上面的数据的智能使用可以给你你想要的东西,但你需要使用你所有的语法知识和编程知识,它仍然会非常粗粒度。

答案 1 :(得分:1)

听起来你可能会接受一些实验,在这种情况下,工具包方法可能是最好的?如果是这样,请查看适用于Python的NLTK Natural Language Toolkit。在Apache许可下开源,并且有一些关于它的优秀书籍(包括O'Reilly的一本书,也是根据创意公共许可在线发布的)。

相关问题