用于检测文本中语法单元的软件或算法

时间:2015-04-18 15:07:59

标签: algorithm linguistics

我不确定这是否适合stackoverflow,但也许你们会建议在哪里提出这个问题,但无论如何它都在这里。假设我有几句像这样的文字:

  约翰每天都在看报纸。现在他刚读完了   一。他会读另一本书,甚至可能会读一本小书   明天。

这个小提取物包含以下语法单位:

  1. 目前简单(读取)
  2. 现在完美(已完成)
  3. 未来简单(将阅读)
  4. modal verb may
  5. 您是否知道任何定义识别这些语法模式的规则的软件,算法或研究?

2 个答案:

答案 0 :(得分:1)

如果要使用Ruby,也可以使用this读取TreeTop或者使用其他编程语言找到等效的解析器。

答案 1 :(得分:1)

NTLK是python的自然语言解析器,它通过标记单词来工作。您可以查看一些示例here。它创建了一个parse-tree,它对这些类型的问题非常有用。

我还没有看到它区分简单和完美,但可以修改它。