阻止引理是否提供任何有用的输出?

时间:2017-10-25 23:12:07

标签: python nlp nltk stemming lemmatization

我目前正在使用神经网络模型,该模型将单词和短语作为一个单词样式模型中的特征(即,根据输入数据中出现的单词或短语,填充有1和0的向量)。

要清理一些单词并减少将输入模型的唯一单词或短语的数量,同事和我使用nltk python模块进行词干化和词形还原。在我想到它之后,这似乎没有意义,但是阻止这些引理似乎最大限度地减少了独特输入的数量,所以我们用它来运行。

我的问题是,阻止引理是否有害?它会伤害结果吗?这样做有意义吗?

我没有发现任何人在任何地方提出这样的问题所以我认为这根本没有用。

0 个答案:

没有答案