automata-theory - 自然语言处理（NLP）

尽管有许多技术可以进行NLP，但最先进的方法是使用深度学习。使用深度学习技术在NLP中显示了许多重大改进。之所以发生这种情况，是因为可以以低成本获得大量处理能力。如果您想阅读NLP领域或任何其他研究领域中使用的前沿技术，请访问google Scholar（https://scholar.google.com/）。

您想要问的真正问题似乎是：“自然语言处理中有哪些有效的技巧？”但我会先解决你的问题。

首先，FSA（有限状态自动机）不是PDA（Push Down Automata）都不足以模拟语言。 FSA可以处理常规语言。然而，他们甚至不能回答一个词是否是回文的问题。 PDA更强大，可以回答这些问题。图灵机提供通用计算，对编写任意复杂程序非常有用。

现在开始弥合这个差距。自然语言不是常规语言。因此，FSA无法处理它们。诸如LR（k）语法之类的一些无上下文语法由PDA处理，然而自然人类语言不是无上下文的。举个例子。以下三个陈述。 “吉尔开车去杂货店和她的朋友莎莉见面，然后才拿起她的孩子。莎莉买了三盒麦片。然后她开车去了学校。”虽然这是一个很差的语法，但它是“自然的”，因为它们是人们所做的话语，而且通常是其他人可以解析的。第三句中代词“她”的前提明确指的是吉尔，因为她是有孩子的人。但是，它含糊不清，我们必须推断这种关联。

自然人类语言中语境的歧义程度使得无法进行确定性解析。相反，我们转向统计和决策理论领域，以便我们推断出最大可能的沟通模式。

语音和写作中的局部性但非确定性是使机器学习技术的应用（例如深度递归神经网络的利用与其基于经典规则的对应物相比非常有效）的事情之一。

虽然术语神经网络有点用词不当，因为从神经学的角度来看，人类大脑最终远比这些基本模型复杂得多，通过近似推理的一般学习表面上接近现实。我们可以更好地将这些方法称为“可微分计算”，但这是另一个时间的题外话。

总结。您实际问过的问题的答案是PDA将会产生比FSA更好的模型，但与最基本的统计方法相比，这两者都将毫无价值。

如果您对NLP感到好奇，我实际上会推荐机器学习课程和深度学习的后续课程。

Andrew Ng有一系列针对初学者的优秀课程。在那之后，我会跟进Sirajs关于Tensorflow深度学习的课程。

自然语言处理（NLP）

2 个答案: