Levenshtein非英语语言的距离

时间:2012-03-26 09:13:37

标签: string levenshtein-distance

Levenshtein距离除英语之外还有哪些其他语言支持其实施?

我知道语言需要基于单字符的表示(而不是像荷兰语那样将两个或多个字符视为单个实体?),并想知道哪些语言属于/不属于此类别。

由于 Abhishek S

1 个答案:

答案 0 :(得分:1)

在数学意义上,Levenshtein距离定义在任意弦上;它不是特定于语言的。您应该确保在正确的表示级别上计算它,合理的默认值是在某些normalization之后的Unicode代码点的级别。如果您正在处理的语言总是需要两个符号来表示任何有意义的符号,那么在符号对上计算Levenshtein距离。

[我不确定你的意思是多个角色是荷兰语中的“单一实体”,但如果你的意思是ij ligature,那从未阻止我将Levenshtein应用于荷兰文:)]