另一个搬运工干扰算法实施问题?

时间:2010-12-23 23:33:40

标签: algorithm nlp porter-stemmer

我正在尝试实施搬运工干扰算法,但我对这一点有了难度

  

步骤1c

(*v*) Y -> I                    happy        ->  happi
                                sky          ->  sky

这不是我们想要做的事情的反面,为什么算法会将Y转换为I.

此处为完整算法http://tartarus.org/~martin/PorterStemmer/def.txt

由于

1 个答案:

答案 0 :(得分:2)

Porter词干和其他stemming algorithms并不总是返回单词;他们返回word stems。目标是相关的词应该具有相同的词干。只要“快乐”,“快乐”和“快乐”都减少到同一个词干,那么即使词干不是真正的词,你的词干也会正常工作。

相关问题